Neural Network

Français

Qu'est-ce que le réseau de neurones
1. Plongez dans le neurone
2. Comment un réseau de neurones simule-t-il une fonction arbitraire
3. Pourquoi avons-nous besoin de réseaux de neurones
Comment construire un réseau de neurones
1. Réseau de neurones entièrement connecté
2. Utiliser un outil graphique pour concevoir un réseau de neurones
3. La "fonction d'activation" de la couche de sortie
Comment entraîner un réseau de neurones
1. Algorithme et principe d'apprentissage
2. Construisez et entraînez des réseaux de neurones à partir de zéro
3. Réécrire le code à l'aide de PyTorch
4. Utiliser un outil graphique pour entraîner le réseau de neurones
Quelques problèmes importants de réseau de neurones
1. Structure du réseau
2. Surapprentissage
3. Insuffisance
4. Surapprentissage vs sous-apprentissage
5. Initialisation
6. Dégradé disparaissant et dégradé explosif
Réseau de neurones convolutifs (CNN)
1. 1D-convolution
2. Expériences de convolution 1D
3. Mise en commun 1D
4. Expériences 1D-CNN
5. 2D-CNN
6. Expériences 2D-CNN
Réseau de neurones récurrents (RNN)
1. Vanille RNN
2. Seq2seq, Autoencoder, Encoder-Decoder
3. RNN avancé
4. Expérience de classification RNN
Traitement du langage naturel
1. Embedding: convertir des symboles en valeurs
2. Classification de texte 1
3. Classification de texte 2
4. TextCNN
5. Reconnaissance d'entité
6. Segmentation de mots, étiquetage et découpage de parties de discours
7. Marquage de séquence en action
8. RNN bidirectionnel
9. BI-LSTM-CRF
10. Attention
Modèles de langage
1. Modèle unigramme
2. Modèle bigramme
3. Modèle trigramme
4. Modèle RNN de langage
5. Modèle Transformer de langage
Algèbre linéaire
1. Vecteur
2. Matrice
3. Plonger dans la multiplication matricielle
4. Tenseur

Structure du réseau

Aperçu

Dans le domaine de l'apprentissage en profondeur, nous voyons souvent des informations sur le classement d'un certain modèle. Une percée majeure dans une tâche d'algorithme de réseau neuronal dépend d'abord de l'ensemble de données et ensuite de la structure du modèle.

La percée dans le domaine de l'image, le jeu de données ImageNet est indispensable, c'est l'importance du jeu de données, car il enregistre les informations de la fonction objectif. Mais nous avons appris de la section précédente que l'ensemble de données est défectueux, qu'il ne peut pas enregistrer complètement les informations de la fonction objectif et qu'une partie sera perdue. La qualité de l'ensemble de données réside dans son taux de rétention des informations sur les fonctions objectives.

La tâche de la phase d'apprentissage est d'utiliser les informations contenues dans l'ensemble de données (fonction de l'ensemble de données $d(\mathbf x)$ ) pour restaurer la fonction objectif $o(\mathbf x)$ . En raison de diverses restrictions, nous n'obtiendrons qu'une fonction $f(\mathbf x)$ qui se rapproche de la fonction objectif.

Un bon modèle a une forme fonctionnelle correspondante plus proche de la fonction objectif, ce qui permet de mieux compenser les défauts de l'ensemble de données et d'obtenir de meilleurs résultats.

Affichage visuel

2 points

Pour citer l'exemple de la section précédente, l'ensemble de données a 2 points, et le taux de rétention des informations de cet ensemble de données est très faible.


Ensemble de données

Faire différentes hypothèses sur sa forme fonctionnelle:


Forme en ligne droite


 $w$ 3
Forme parabolique

En ajustant les paramètres de $w$ , nous pouvons obtenir d'innombrables paraboles, et toutes peuvent parfaitement simuler la fonction de jeu de données $d(\mathbf x)$

Il existe de nombreuses autres formes fonctionnelles, et la forme fonctionnelle elle-même est infinie. D'autres formes de fonctions peuvent également parfaitement simuler la fonction de jeu de données $d(\mathbf x)$

3 points


Forme en ligne droite


 $w$ 3
Forme parabolique

5 points


Forme en ligne droite


 $w$ 25
Forme parabolique

Avec l'augmentation des points de données, la forme fonctionnelle se rapproche d'une ligne droite, mais les possibilités sont encore infinies.

Résumer

L'information sous forme de fonction objectif ne peut pas être obtenue à partir des données, et les possibilités sont infinies.

Concevoir la structure du réseau de neurones

Les informations contenues dans l'ensemble de données sont insuffisantes. Nous devons obtenir des informations supplémentaires d'autres endroits et les utiliser pour guider la conception structurelle du réseau de neurones afin de compenser le manque d'informations.

Structure spéciale

Dans diverses tâches d'apprentissage en profondeur, les bons modèles utilisent des structures hautement spécialisées. Comme:

Tâche d'image: CNN bidimensionnel
Tâches de texte: Embedding, CNN unidimensionnel, RNN, CRF, Transformer, etc.

De nombreuses structures spécialisées sont conçues en référence au processus de traitement d'une certaine fonction objective. Par exemple, CNN simule la structure organisationnelle du nerf optique. Bien que la forme spécifique de la fonction objectif soit inconnue, les gens peuvent souvent obtenir certaines de ses informations et obtenir de meilleurs résultats en simulant le processus de traitement de la fonction objectif.

Design structurel

La structure du réseau de neurones est le squelette de l'algorithme, qui détermine directement le potentiel ultime de l'algorithme. Si le squelette n'est pas bien conçu, peu importe comment vous l'entraînez, il ne sera finalement pas satisfaisant.


 $w$ 1
 $b$ 2
Structure inappropriée


 $a$ 1
 $b$ 0
 $c$ 0
Structure appropriée

La structure d'un réseau de neurones ne peut pas être obtenue par la formation et nécessite généralement une conception artificielle.

Il existe également des recherches d'architecture par le biais d'algorithmes, c'est-à-dire d'essayer une variété d'architectures différentes et de choisir la meilleure en fonction de l'effet d'entraînement final, ce qui nécessite une énorme puissance de calcul et ne convient qu'à un très petit nombre d'institutions. avec de solides ressources financières.

Pour concevoir artificiellement une bonne structure de réseau de neurones, nous avons besoin de:

Avoir une certaine compréhension ou une conjecture raisonnable de la fonction objectif correspondant à la tâche;
Familiarisez-vous avec la structure commune du réseau de neurones et comprenez son principe;
Utilisez ces structures pour vous assembler en une structure similaire à la fonction objectif.

Résumer

L'ensemble de données ne peut pas fournir suffisamment d'informations et la structure du réseau de neurones doit compenser le manque d'informations
Les informations de la structure du réseau de neurones proviennent de la compréhension et de la simulation du processus de traitement de la fonction objectif

Structure du réseau

Aperçu

Affichage visuel

2 points

3 points

5 points

Résumer

Concevoir la structure du réseau de neurones

Structure spéciale

Design structurel

Résumer

problème

Les réseaux de neurones peuvent simuler des fonctions arbitraires, alors pourquoi devons-nous concevoir sa structure?