Regressione lineare

Partendo dal presupposto di rendere minimi la somma dei quadrati degli scarti fra le y sperimentali e le y teoriche, e che la retta di regressione debba passare per il punto di coordinate (Mx , My ) detto "baricentro" ovvero (media delle x, media valori y), è possibile dimostrare in maniera semplice la formula che dà il coefficiente angolare o pendenza della retta di regressione.


Conoscendo i punti sperimentali (x , y ) si deve trovare la retta che approssima meglio i dati a disposizione:

y=a x + b

a coefficiente angolare, b ordinata all'origine.
Imponendo il passaggio da
(Mx , My ), si ha:

My= a Mx +b

e quindi:

b= My - a Mx

Per semplificare i calcoli operiamo una traslazione che porti l'origine del sistema di riferimento cartesiano nel punto
(Mx , My ). L'equazione della retta da trovare sarà del tipo:

y-
My =a (x- Mx)

Operando la traslazione
Y=y
-My
X=x- Mx

Si ha l'equazione:

Y=a X

 Applicare il metodo dei minimi quadrati vuol dire calcolare la somma dei quadrati degli scarti fra ciascun valore di Yi e il corrispondente valore teorico dato da a Xi :

(Y1-a X1)2 +(Y2-a X2)
2 +...+(Yn-a Xn) 2

Sviluppando i quadrati:

Y1
2   +a2 X1 2 -2 a X1  Y1 +   Y22  +a2 X2 2 -2 a X2  Y2 + ...+  Yn2   +a2 Xn 2 -2 a Xn  Yn=


=Y12+   Y22+ ...+ Yn2 +a2 (X1 2+ X2 2 +...+ Xn 2 )-2 a (X1  Y1+X2  Y2+...+Xn  Yn )

In questa espressione la variabile è a, la pendenza della retta da determinare, ed inoltre questa espressione si può identificare come una semplice parabola con il coefficiente di secondo grado positivo (in rosso). Il vertice della parabola coincide con il minimo cercato. Per determinare per quale valore di a si ha il minimo basta applicare la classica formula del vertice di una parabola: coefficiente di primo grado (in verde) cambiato di segno diviso il doppio del coeffidiente di secondo grado.


a=(X1  Y1+X2  Y2+...+Xn  Yn )/(X1 2+ X2 2 +...+ Xn 2 )

In altri termini a è uguale alla sommatoria degli
Xi  Yi  diviso la sommatoria degli Xi 2.

Adesso basta sostituire, ad Xi, xi-Mx e ad Yi, yi- My .



formula regressione




Regressione quadratica

Nel caso in cui si faccia l'ipotesi di interpretare i dati sperimentali con una parabola di vertice l'origine degli assi cioè di equazione:

y=a x2

si può seguire una dimostrazione semplice della formula che fornisce il coefficiente a della parabola a partire dal rendere minima la somma dei quadrati degli scarti fra il valore delle y sperimentali e il corrispondente valore delle y teoriche.

La somma da rendere minima si può scrivere, analogamente a prima, come:

(y1-a x12 )2 +(y2-a x22 )2 +...+(yn-a xn2 ) 2

Sviluppando i quadrati:

y12   +a2x14 -2 a x12 y1 +   y22  +a2 x24 -2 a x22  y2 + ...+  yn2   +a2 xn4 -2 a xn2  yn=


=y12+   y22+ ...+ yn2 +a2 (x1 4+ x2 4 +...+ xn 4)-2 a (x12 y1+x2 2 y2+...+xn 2 yn )

Anche questa espressione si può considerare una parabola nella variabile a e il minimo si raggiunge nel vertice che si può calcolare semplicemente:

a=
(x12 y1+x2 2 y2+...+xn 2 yn )/(x1 4+ x2 4 +...+ xn 4)

Ovvero

a=formula regressione