cerca

Coefficiente (o indice) di correlazione

Introduciamo subito la definizione di coefficiente (o indice) di correazione.

Definizione

Assegnate le serie di dati Studenti/matematica e Studenti/matematica, si definisce coefficiente di correlazione campionario, o indice di correlazione di Pearson, il seguente valore numerico

Studenti/matematica
1

dove Studenti/matematica indica la covarianza di Studenti/matematica e Studenti/matematica e Studenti/matematica e Studenti/matematica indicano, rispettivamente, la deviazione standard campionaria di Studenti/matematica e Studenti/matematica.

Il coefficiente di correlazione è un indice sempre compreso tra -1 ed 1 ed in particolare:

  • se Studenti/matematica, le serie di dati Studenti/matematica e Studenti/matematica si dicono direttamente correlate, oppure correlate positivamente e quanto più il valore Studenti/matematica si avvicina ad 1 tanto più forte è la correlazione positiva;

  • se Studenti/matematica, le serie di dati Studenti/matematica e Studenti/matematica si dicono non correlate;

  • se Studenti/matematica, le serie di dati Studenti/matematica e Studenti/matematica si dicono inversamente correlate, oppure correlate negativamente e quanto più il valore Studenti/matematica si avvicina ad -1 tanto più forte è la correlazione negativa.

Si può dimostrare che il coefficiente di correlazione è uguale a 1 o a -1 se e solo se i punti sono tutti perfettamente allineati sulla stessa retta.

Il coefficiente di correlazione campionario è un indice statistico adimensionale, pertanto è da privilegiarsi rispetto alla covarianza campionaria quando si vuole capire se esiste un legame lineare tra due serie di dati, indipenedentemente dalle unità di misura scelte.

Esempio

Si sono studiati lo sviluppo del femore e dell’omero di un feto tramite immagini ecografiche. Sono stati trascritti i dati relativi alla lunghezza delle due ossa, rilevati ogni quattro settimane, a partire dalla dodicesima settimana di gestazione sino alla quarantesima. I dati sono riportati in tabella

Studenti/matematica

Calcolare l’indice di correlazione campionaria del carattere Studenti/matematica, “lunghezza dell'omero”, e Studenti/matematica, “lunghezza del femore”, di un feto.

Per calolare il coefficientre di correlazione tra Studenti/matematica e Studenti/matematica è necessario calcolare la covarianza di Studenti/matematica e Studenti/matematica e le deviazioni standard Studenti/matematica e Studenti/matematica.

La covarianza risulta essere:

Studenti/matematica

mentre le medie sono

Studenti/matematica
Studenti/matematica

per cui utilizzando la definizione di scarto quadratico medio

Studenti/matematica

e facendo i semplici calcoli si ottiene

Studenti/matematica
2
Studenti/matematica
3

Pertanto, utilizzando la (1), è possibile calcolare il coefficiente di correlazione campionario tra Studenti/matematica e Studenti/matematica

Studenti/matematica
4

Il valore determinato evidenzia immediatamente che le grandezze, come c’era da aspettarsi, sono fortemente correlate tra loro in senso positivo.