lab
Neural Network
Italiano

Immergiti nel neurone

Panoramica

Dalla sezione precedente (Cos'è la rete neurale), abbiamo appreso che una rete neurale è una funzione, che è composta da neuroni, e anche il neurone è una funzione.


Il neurone può continuare a essere suddiviso in 2 sottofunzioni:

  • Funzione lineare elemento nn: g(x1,...,xn)g(x_1, ..., x_n)
  • funzione unaria non lineare: h(x)h(x)

La funzione rappresentata dal neurone è:

f(x1,...,xn)=h(g(x1,...,xn))f(x_1, ..., x_n) = h(g(x_1, ..., x_n))

Funzione lineare g(x1,...,xn)g(x_1, ..., x_n)

La funzione lineare ha la seguente forma:

g(x1,...,xn)=w1x1+...,wnxn+bg(x_1, ..., x_n) = w_1x_1 + ..., w_nx_n + b

Tra questi, w1,...,wn,bw_1, ..., w_n, b sono tutti parametri e diverse funzioni lineari hanno parametri diversi.

Funzione lineare unaria

Quando n=1n = 1, g(x1)=w1x1+bg(x_1) = w_1x_1 + b, l'immagine della funzione è una linea retta:

w1w_11
bb0

Funzione lineare binaria

Quando n=2n = 2, g(x1,x2)=w1x1+w2x2+bg(x_1, x_2) = w_1x_1 + w_2x_2 + b, l'immagine della funzione è un piano:

w1w_10
w2w_21
bb0

Funzione lineare elemento nn

Quando n>2n > 2, l'immagine della funzione è un iperpiano. Oltre al 3D, la visualizzazione non è conveniente. Ma puoi immaginare che la sua caratteristica sia diritta.

Funzione non lineare h(x)h(x)

È facile capire dal nome che una funzione non lineare è una funzione diversa da una funzione lineare. Una funzione lineare è retta e una funzione non lineare è curva. Come la funzione sigmoid più comune:

Funzione di attivazione

Nelle reti neurali, chiamiamo questa funzione unaria non lineare funzione di attivazione. Per alcune funzioni di attivazione comuni, fare riferimento a funzione di attivazione nella knowledge base, dove:

  • Linear: f(x)=xf(x) = x è una funzione lineare, il che significa che non viene utilizzata una funzione non lineare
  • Softmax è un caso speciale. A rigor di termini, non è una funzione di attivazione

Necessità

Perché una funzione di attivazione non lineare dovrebbe essere seguita da una funzione lineare?


Questo è perché:

  1. Se i neuroni sono tutte funzioni lineari, anche la rete neurale composta da neuroni è una funzione lineare.

Come il seguente esempio:

  • f1(x,y)=w1x+w2y+b1f_1(x, y) = w_1x + w_2y + b_1
  • f2(x,y)=w3x+w4y+b2f_2(x, y) = w_3x + w_4y + b_2
  • f3(x,y)=w5x+w6y+b3f_3(x, y) = w_5x + w_6y + b_3

Allora la funzione rappresentata dall'intera rete neurale è:

f3(f1(x1,x2,x3),f2(x1,x2,x3))=w5(w1x1+w2x2+b1)+w6(w3x2+w4x3+b2)+b3=(w1w5)x1+(w2w5+w3w6)x2+(w4w6)x3+(w5b1+w6b2+b3)\begin{aligned} &f_3(f_1(x_1, x_2, x_3), f_2(x_1, x_2, x_3)) \\ = &w_5(w_1x_1 + w_2x_2 + b_1) + w_6(w_3x_2 + w_4x_3 + b_2) + b_3 \\ = &(w_1w_5)x_1 + (w_2w_5 + w_3w_6)x_2 + (w_4w_6)x_3 + (w_5b_1 + w_6b_2 + b_3) \\ \end{aligned}

Questa è una funzione lineare ternaria.

  1. La funzione obiettivo che dobbiamo costruire contiene varie funzioni e la funzione lineare è solo una di queste.

Speriamo che le reti neurali possano simulare funzioni arbitrarie, non solo funzioni lineari. Quindi abbiamo aggiunto una funzione di attivazione non lineare e "piegato" la funzione lineare.

Neurone completo

Il neurone completo combina una funzione lineare e una funzione di attivazione non lineare, rendendolo più interessante e potente.

Funzione unaria

Quando n=1n = 1, g(x1)=w1x1+bg(x_1) = w_1x_1 + b, utilizzando la funzione di attivazione sigmoid, la funzione corrispondente del neurone è:

h(g(x))=sigmoid(wx+b)h(g(x))=\text{sigmoid}(wx + b)

L'immagine della funzione è:

ww1
bb0

Funzione binaria

Quando n=2n = 2, g(x1,x2)=w1x1+w2x2+bg(x_1, x_2) = w_1x_1 + w_2x_2 + b, utilizzando la funzione di attivazione sigmoid, la funzione corrispondente del neurone è:

h(g(x))=sigmoid(w1x1+w2x2+b)h(g(x))=\text{sigmoid}(w_1x_1 + w_2x_2 + b)

L'immagine della funzione è:

w1w_10
w2w_21
bb0

Funzione nn-elemento

A causa del problema di visualizzazione, qui dipende interamente dalla mia immaginazione! ?

Domanda

Perché la rete neurale può simulare funzioni complesse dalla combinazione di neuroni?

Puoi immaginare intuitivamente come simulare una funzione leggermente più complicata attraverso semplici neuroni.