cerca

Retta di regressione lineare

Un passo significativo per la verifica dell’esistenza di una correlazione tra i caratteri osservati, consiste nel disegnare un diagramma di dispersione, cioè rappresentare nel piano cartesiano le osservazioni con punti o cerchietti.

Se il diagramma di dispersione suggerisce una relazione lineare tra i dati ed inoltre, il valore del coefficiente di correlazione in modulo è prossimo ad uno, anche se tra i dati non esiste una relazione perfettamente lineare, ha senso determinare l’equazione di una retta che approssimi i dati nel “miglior modo possibile”.

Il metodo dei minimi quadrati consente di determinare l’equazione di questa retta, detta retta di regressione o dei minimi quadrati. Lo studio del fenomeno suggerirà quale dei caratteri può essere interpretato come variabile indipendente (indicata con Studenti/matematica) e quale come variabile dipendente (indicata con Studenti/matematica).

Definizione

Siano Studenti/matematica e Studenti/matematica i dati sperimentali osservati in una popolazione e si rappresentino nel piano le coppie Studenti/matematica.

Si definisce retta di regressione o dei minimi quadrati la retta di equazione

Studenti/matematica
1

per la quale è minima la quantità

Studenti/matematica
2

che rappresenta la somma dei quadrati delle distanze di ciascuna coppia Studenti/matematica dal corrispondente punto sulla retta Studenti/matematica.

Studenti/matematica

In particolare accade che:

  • se Studenti/matematica allora risulterà che i punti Studenti/matematica sono allineati sulla retta Studenti/matematica con Studenti/matematica

  • se Studenti/matematicaallora risulterà che i punti Studenti/matematica sono allineati sulla retta Studenti/matematica con Studenti/matematica.

Si dimostra che i coefficienti Studenti/matematica e Studenti/matematica della retta di regressione possono calcolarsi mediante le seguenti formule

Studenti/matematica
3
Studenti/matematica
4

Esempio

Nella tabella che segue sono riportate le misure del volume di un gas a differenti temperature e nella figura è riportato il relativo grafico di dispersione

Studenti/matematica
Studenti/matematica
1

Si determini il coefficiente di correlazione e la retta di regressione lineare.

Per calcolare il coefficiente di correlazione campionario è necessario determinare la covarianza campionaria dei valori della temperatura e del volume e le relative deviazioni standard. Si indichi con Studenti/matematica la serie di dati relativi alle rilevazioni delle temperature e con Studenti/matematica la serie di dati relative alle rilevazioni dei volumi.

Dalla definizioni della covarianza ricaviamo

Studenti/matematica

mentre per lo scarto quadratico medio abbiamo

Studenti/matematica
Studenti/matematica

Pertanto, il coefficiente di correlazione cercato vale

Studenti/matematica
5

Un valore del coefficiente di correlazione campionario così prossimo ad 1 ed il diagramma di dispersione riportato in figura 1, suggeriscono l’esistenza di una relazione lineare tra i caratteri osservati. Ha senso, pertanto, determinare la retta di regressione lineare.

Calcolando i valori delle medie Studenti/matematicae Studenti/matematica ed utilizzando le (3) e (4), è possibile individuare i coefficienti della retta di regressione lineare

Studenti/matematica
Studenti/matematica
Studenti/matematica
Studenti/matematica

Pertanto la retta di regressione lineare ha equazione:

Studenti/matematica