Neural Network

Deutsch

Was ist ein neuronales Netzwerk?
1. Tauchen Sie ein in das Neuron
2. Wie simuliert ein neuronales Netz eine beliebige Funktion
3. Warum brauchen wir neuronale Netze
Wie baut man ein neuronales Netz auf?
1. Vollständig verbundenes neuronales Netzwerk
2. Verwenden Sie ein grafisches Tool, um ein neuronales Netzwerk zu entwerfen
3. Die "Aktivierungsfunktion" der Ausgabeschicht
So trainieren Sie ein neuronales Netz
1. Lernalgorithmus und -prinzip
2. Erstellen und trainieren Sie neuronale Netze von Grund auf neu
3. Schreiben Sie den Code mit PyTorch um
4. Verwenden Sie ein grafisches Tool, um das neuronale Netzwerk zu trainieren
Einige wichtige Probleme des neuronalen Netzes
1. Netzwerkstruktur
2. Überanpassung
3. Unteranpassung
4. Überanpassung vs. Unteranpassung
5. Initialisierung
6. Verschwindender Gradient und explodierender Gradient
Convolutional Neural Network (CNN)
1. 1D-Faltung
2. 1D-Faltungsexperimente
3. 1D-Pooling
4. 1D-CNN-Experimente
5. 2D-CNN
6. 2D-CNN Experimente
Rekurrentes neuronales Netz (RNN)
1. Vanille RNN
2. Seq2seq, Autoencoder, Encoder-Decoder
3. Erweiterte RNN
4. RNN-Klassifikationsexperiment
Verarbeitung natürlicher Sprache
1. Embedding: Symbole in Werte umwandeln
2. Textkategorisierung 1
3. Textkategorisierung 2
4. TextCNN
5. Entitätserkennung
6. Wortsegmentierung, Wortart-Tagging und Chunking
7. Sequenz-Tagging in Aktion
8. Bidirektionales RNN
9. BI-LSTM-CRF
10. Beachtung
Sprachmodelle
1. n-gram-Modelle: Unigram
2. n-gram-Modelle: Bigram
3. n-gram-Modelle: Trigram
4. RNN-Sprachmodelle
5. Transformer-Sprachmodelle
Lineare Algebra
1. Vektor
2. Matrix
3. Eintauchen in die Matrixmultiplikation
4. Tensor

Netzwerkstruktur

Überblick

Im Bereich Deep Learning sehen wir oft Nachrichten über das Ranking eines bestimmten Modells. Ein wichtiger Durchbruch bei der Aufgabe eines neuronalen Netzwerkalgorithmus hängt erstens vom Datensatz und zweitens von der Modellstruktur ab.

Der Durchbruch im Bildbereich, der ImageNet-Datensatz ist unverzichtbar, das ist die Bedeutung des Datensatzes, denn er erfasst die Informationen der Zielfunktion. Aus dem vorherigen Abschnitt haben wir jedoch gelernt, dass der Datensatz fehlerhaft ist, die Informationen der Zielfunktion nicht vollständig erfassen kann und ein Teil davon verloren geht. Die Qualität des Datensatzes liegt in seiner Retentionsrate von objektiven Funktionsinformationen.

Die Aufgabe der Trainingsphase besteht darin, die Informationen im Datensatz (Datensatzfunktion $d(\mathbf x)$ ) zu verwenden, um die Zielfunktion $o(\mathbf x)$ wiederherzustellen. Aufgrund verschiedener Einschränkungen erhalten wir nur eine Funktion $f(\mathbf x)$ , die die Zielfunktion approximiert.

Ein gutes Modell hat eine entsprechende funktionale Form, die näher an der Zielfunktion liegt, wodurch die Fehler des Datensatzes besser ausgeglichen und bessere Ergebnisse erzielt werden können.

Visuelle Darstellung

2 Punkte

Um das Beispiel im vorherigen Abschnitt zu zitieren, hat der Datensatz 2 Punkte und die Informationsspeicherungsrate dieses Datensatzes ist sehr gering.


Datensatz

Machen Sie verschiedene Annahmen über seine funktionale Form:


Gerade Linienform


 $w$ 3
Parabolische Form

Durch Anpassen der Parameter von $w$ können wir unzählige Parabeln erhalten und alle können die Datensatzfunktion $d(\mathbf x)$ . perfekt simulieren

Es gibt viele andere Funktionsformen, und die Funktionsform selbst ist unendlich. Auch andere Funktionsformen können die Datensatzfunktion $d(\mathbf x)$ . perfekt simulieren

3 Punkte


Gerade Linienform


 $w$ 3
Parabolische Form

5 Punkte


Gerade Linienform


 $w$ 25
Parabolische Form

Mit der Zunahme der Datenpunkte nähert sich die Funktionsform einer Geraden, aber es gibt noch unendlich viele Möglichkeiten.

Zusammenfassen

Die Information in Form der Zielfunktion kann aus den Daten nicht gewonnen werden und es gibt unendlich viele Möglichkeiten.

Entwerfen Sie die Struktur des neuronalen Netzes

Die Informationen im Datensatz sind unzureichend. Wir müssen zusätzliche Informationen von anderen Stellen beschaffen und diese nutzen, um den strukturellen Entwurf des neuronalen Netzes zu leiten, um den Informationsmangel auszugleichen.

Spezielle Struktur

Bei verschiedenen Deep-Learning-Aufgaben verwenden gute Modelle hochspezialisierte Strukturen. mögen:

Bildaufgabe: 2-dimensionales CNN
Textaufgaben: Embedding, 1-dimensional CNN, RNN, CRF, Transformer, etc.

Viele spezialisierte Strukturen werden mit Bezug auf den Verarbeitungsprozess einer bestimmten Zielfunktion entworfen. CNN simuliert beispielsweise die Organisationsstruktur des Sehnervs. Obwohl die spezifische Form der Zielfunktion unbekannt ist, können Menschen oft einige ihrer Informationen erhalten und bessere Ergebnisse erzielen, indem sie den Verarbeitungsprozess der Zielfunktion simulieren.

Strukturiertes Design

Die Struktur des neuronalen Netzes ist das Skelett des Algorithmus, das direkt das ultimative Potenzial des Algorithmus bestimmt. Wenn das Skelett nicht gut gestaltet ist, egal wie man es trainiert, wird es am Ende nur unbefriedigend sein.


 $w$ 1
 $b$ 2
Unangemessene Struktur


 $a$ 1
 $b$ 0
 $c$ 0
Angemessene Struktur

Die Struktur eines neuronalen Netzes kann nicht durch Training erlangt werden und erfordert in der Regel ein künstliches Design.

Es gibt auch Architektur-Suchen durch Algorithmen, d. h. das Ausprobieren verschiedener Architekturen und die Auswahl der besten nach dem endgültigen Trainingseffekt, was sehr viel Rechenleistung erfordert und nur für eine sehr kleine Anzahl von Institutionen geeignet ist mit starken finanziellen Mitteln.

Um eine gute neuronale Netzstruktur künstlich zu entwerfen, benötigen wir:

ein gewisses Verständnis oder eine vernünftige Vermutung der der Aufgabe entsprechenden Zielfunktion haben;
mit der gemeinsamen Struktur des neuronalen Netzes vertraut sein und sein Prinzip verstehen;
Verwenden Sie diese Strukturen, um eine Struktur ähnlich der Zielfunktion aufzubauen.

Zusammenfassen

Der Datensatz kann nicht genügend Informationen liefern und die Struktur des neuronalen Netzes muss den Informationsmangel ausgleichen
Die Informationen der neuronalen Netzstruktur stammen aus dem Verständnis und der Simulation des Verarbeitungsprozesses der Zielfunktion

Netzwerkstruktur

Überblick

Visuelle Darstellung

2 Punkte

3 Punkte

5 Punkte

Zusammenfassen

Entwerfen Sie die Struktur des neuronalen Netzes

Spezielle Struktur

Strukturiertes Design

Zusammenfassen

Problem

Neuronale Netze können beliebige Funktionen simulieren, warum also müssen wir ihre Struktur entwerfen?