cerca

Statistiche bivariate e covarianza

Quando si osservano due caratteri diversi, Studenti/matematica e Studenti/matematica, riferiti ad una medesima popolazione, dei quali conosciamo i valori numerici Studenti/matematica e Studenti/matematica, si può fare riferimento ad indici statistici che possono descrivere come i due insiemi di dati variano tra loro.

Uno tra questi è la covarianza campionaria

Studenti/matematica
1

dove Studenti/matematica e Studenti/matematica sono le medie campionarie delle due serie di dati.

Come per la deviazione standard e la varianza campionaria, in alcuni testi è possibile trovare una definizione differente di covarianza campionaria che in luogo della (1) utilizza la seguente altra formula

Studenti/matematica
2

Una covarianza campionaria positiva indica che è ragionevole attendersi un aumento della seconda grandezza all’aumentare della prima oppure una diminuzione della seconda al decrescere della prima. In altri termini, una covarianza campionaria positiva indica che le due serie di dati hanno un comportamento “concorde”. Viceversa, una covarianza campionaria negativa indica che i dati hanno comportamenti mediamente “discordi”. Una covarianza campionaria pressoché uguale a zero indica che i dati non sono in relazione diretta tra loro.

Esempio 1

Si sono studiati lo sviluppo del femore e dell'omero di un feto tramite immagini ecografiche. Sono stati trascritti i dati relativi alla lunghezza delle due ossa, rilevati ogni quattro settimane, a partire dalla dodicesima settimana di gestazione sino alla quarantesima. I dati sono riportati in tabella

Studenti/matematica

Calcolare la covarianza campionaria dei due caratteri.

Si indichi con Studenti/matematica il carattere “lunghezza dell’omero” e con Studenti/matematica il carattere “lunghezza del femore”.

Secondo la (1), per calcolare la covarianza campionaria, è necessario determinare i valori della media campionaria dei due caratteri. Per cui si ha:

Studenti/matematica
Studenti/matematica

Utilizzando la (1) è possibile calcolare la covarianza campionaria di Studenti/matematica e Studenti/matematica

Studenti/matematica
Studenti/matematica
Studenti/matematica
Studenti/matematica
Studenti/matematica
Studenti/matematica

Poichè risulta che la covarianza campionaria è un numero positivo, si può concludere che le due serie di dati si comportano in modo concorde.

C'è da tenere presente che la covarianza risente della scala di misura utilizzata: se infatti, nell’esempio precedente, al posto di misurare le ossa in millimetri si fosse utilizzato il decimetro, si sarebbe ottenuta una covarianza campionaria “piccolissima”, prossima allo zero, e si sarebbe erroneamente potuto pensare che non intercorre alcuna relazione nello sviluppo delle due ossa.

Per questo motivo è conveniente considerare il coefficiente di correlazione campionaria, un indice statistico che possiede il pregio di essere un numero puro, indipendente dalle unità di misura prescelte.