Segmentazione delle parole, tag e suddivisione in parti del discorso
Tag di sequenza in azione
RNN Bi bidirezionale
BI-LSTM-CRF
Attenzione
Modelli di linguaggio
Modello n-gram: Unigram
Modello n-gram: Bigram
Modello n-gram: Trigram
Modello RNN
Modello Transformer
Algebra lineare
Vettore
Matrice
Immergiti nella moltiplicazione di matrici
Tensore
Immergiti nel neurone
Panoramica
Dalla sezione precedente (Cos'è la rete neurale), abbiamo appreso che una rete neurale è una funzione, che è composta da neuroni, e anche il neurone è una funzione.
Il neurone può continuare a essere suddiviso in 2 sottofunzioni:
Funzione lineare elemento n: g(x1,...,xn)
funzione unaria non lineare: h(x)
La funzione rappresentata dal neurone è:
f(x1,...,xn)=h(g(x1,...,xn))
Funzione lineare g(x1,...,xn)
La funzione lineare ha la seguente forma:
g(x1,...,xn)=w1x1+...,wnxn+b
Tra questi, w1,...,wn,b sono tutti parametri e diverse funzioni lineari hanno parametri diversi.
Funzione lineare unaria
Quando n=1, g(x1)=w1x1+b, l'immagine della funzione è una linea retta:
w11
b0
Funzione lineare binaria
Quando n=2, g(x1,x2)=w1x1+w2x2+b, l'immagine della funzione è un piano:
w10
w21
b0
Funzione lineare elemento n
Quando n>2, l'immagine della funzione è un iperpiano. Oltre al 3D, la visualizzazione non è conveniente. Ma puoi immaginare che la sua caratteristica sia diritta.
Funzione non lineare h(x)
È facile capire dal nome che una funzione non lineare è una funzione diversa da una funzione lineare. Una funzione lineare è retta e una funzione non lineare è curva. Come la funzione sigmoid più comune:
Funzione di attivazione
Nelle reti neurali, chiamiamo questa funzione unaria non lineare funzione di attivazione. Per alcune funzioni di attivazione comuni, fare riferimento a funzione di attivazione nella knowledge base, dove:
Linear: f(x)=x è una funzione lineare, il che significa che non viene utilizzata una funzione non lineare
Softmax è un caso speciale. A rigor di termini, non è una funzione di attivazione
Necessità
Perché una funzione di attivazione non lineare dovrebbe essere seguita da una funzione lineare?
Questo è perché:
Se i neuroni sono tutte funzioni lineari, anche la rete neurale composta da neuroni è una funzione lineare.
Come il seguente esempio:
f1(x,y)=w1x+w2y+b1
f2(x,y)=w3x+w4y+b2
f3(x,y)=w5x+w6y+b3
Allora la funzione rappresentata dall'intera rete neurale è:
La funzione obiettivo che dobbiamo costruire contiene varie funzioni e la funzione lineare è solo una di queste.
Speriamo che le reti neurali possano simulare funzioni arbitrarie, non solo funzioni lineari. Quindi abbiamo aggiunto una funzione di attivazione non lineare e "piegato" la funzione lineare.
Neurone completo
Il neurone completo combina una funzione lineare e una funzione di attivazione non lineare, rendendolo più interessante e potente.
Funzione unaria
Quando n=1, g(x1)=w1x1+b, utilizzando la funzione di attivazione sigmoid, la funzione corrispondente del neurone è:
h(g(x))=sigmoid(wx+b)
L'immagine della funzione è:
w1
b0
Funzione binaria
Quando n=2, g(x1,x2)=w1x1+w2x2+b, utilizzando la funzione di attivazione sigmoid, la funzione corrispondente del neurone è:
h(g(x))=sigmoid(w1x1+w2x2+b)
L'immagine della funzione è:
w10
w21
b0
Funzione n-elemento
A causa del problema di visualizzazione, qui dipende interamente dalla mia immaginazione! ?
Domanda
Perché la rete neurale può simulare funzioni complesse dalla combinazione di neuroni?
Puoi immaginare intuitivamente come simulare una funzione leggermente più complicata attraverso semplici neuroni.