Segmentation de mots, étiquetage et découpage de parties de discours
Marquage de séquence en action
RNN bidirectionnel
BI-LSTM-CRF
Attention
Modèles de langage
Modèle unigramme
Modèle bigramme
Modèle trigramme
Modèle RNN de langage
Modèle Transformer de langage
Algèbre linéaire
Vecteur
Matrice
Plonger dans la multiplication matricielle
Tenseur
Plongez dans le neurone
Aperçu
De la section précédente (Qu'est-ce qu'un réseau de neurones), nous avons appris qu'un réseau de neurones est une fonction, qui est composée de neurones, et que le neurone est également une fonction.
Neuron peut continuer à être scindé en 2 sous-fonctions:
Fonction linéaire de l'élément n: g(x1,...,xn)
fonction non linéaire unaire: h(x)
La fonction représentée par le neurone est:
f(x1,...,xn)=h(g(x1,...,xn))
Fonction linéaire g(x1,...,xn)
La fonction linéaire a la forme suivante:
g(x1,...,xn)=w1x1+...,wnxn+b
Parmi eux, w1,...,wn,b sont tous des paramètres, et différentes fonctions linéaires ont des paramètres différents.
Fonction linéaire unaire
Lorsque n=1, g(x1)=w1x1+b, l'image de la fonction est une ligne droite:
w11
b0
Fonction linéaire binaire
Lorsque n=2, g(x1,x2)=w1x1+w2x2+b, l'image de la fonction est un plan:
w10
w21
b0
Fonction linéaire de l'élément n
Lorsque n>2, l'image de la fonction est un hyperplan. Au-delà de la 3D, la visualisation n'est pas pratique. Mais vous pouvez imaginer que sa caractéristique est droite.
Fonction non linéaire h(x)
Il est facile de comprendre à partir du nom qu'une fonction non linéaire est une fonction différente d'une fonction linéaire. Une fonction linéaire est droite et une fonction non linéaire est courbe. Comme la fonction sigmoid la plus courante:
Fonction d'activation
Dans les réseaux de neurones, nous appelons cette fonction non linéaire unaire fonction d'activation. Pour certaines fonctions d'activation courantes, veuillez vous référer à fonction d'activation dans la base de connaissances, où:
Linéaire: f(x)=x est une fonction linéaire, ce qui signifie qu'une fonction non linéaire n'est pas utilisée
Softmax est un cas particulier. Il ne s'agit pas à proprement parler d'une fonction d'activation
Nécessité
Pourquoi une fonction d'activation non linéaire devrait-elle être suivie d'une fonction linéaire?
Ceci est dû au fait:
Si les neurones sont tous des fonctions linéaires, alors le réseau neuronal composé de neurones est également une fonction linéaire.
Comme l'exemple suivant:
f1(x,y)=w1x+w2y+b1
f2(x,y)=w3x+w4y+b2
f3(x,y)=w5x+w6y+b3
Alors la fonction représentée par l'ensemble du réseau de neurones est:
La fonction objectif que nous devons construire contient diverses fonctions, et la fonction linéaire n'est que l'une d'entre elles.
Nous espérons que les réseaux de neurones pourront simuler des fonctions arbitraires, pas seulement des fonctions linéaires. Nous avons donc ajouté une fonction d'activation non linéaire et "plié" la fonction linéaire.
Neurone complet
Le neurone complet combine une fonction linéaire et une fonction d'activation non linéaire, ce qui le rend plus intéressant et puissant.
Fonction unaire
Lorsque n=1, g(x1)=w1x1+b, en utilisant la fonction d'activation sigmoid, la fonction correspondante du neurone est:
h(g(x))=sigmoid(wx+b)
L'image de la fonction est:
w1
b0
Fonction binaire
Lorsque n=2, g(x1,x2)=w1x1+w2x2+b, en utilisant la fonction d'activation sigmoid, la fonction correspondante du neurone est:
h(g(x))=sigmoid(w1x1+w2x2+b)
L'image de la fonction est:
w10
w21
b0
Fonction d'élément n
En raison du problème de visualisation, cela dépend entièrement de ma propre imagination ici! ??
Question
Pourquoi le réseau de neurones peut simuler des fonctions complexes à partir d'une combinaison de neurones ?
Vous pouvez intuitivement imaginer comment simuler une fonction légèrement plus compliquée grâce à de simples neurones.