Come si calcola il coefficiente di variazione in statistica

Come calcolare il coefficiente di variazione, detto anche deviazione standard relativa, in statistica: formula, esempi pratici e spiegazione passo passo

Come si calcola il coefficiente di variazione in statistica
getty-images

Introduzione

Come si calcola il coefficiente di variazione in statistica
Fonte: getty-images

L'obiettivo della statistica è quello di fornire indicazioni sintetiche sulle rilevazioni statistiche effettuate, tramite l'utilizzo di appropriati indici e valori.

In questo articolo ci occuperemo del calcolo dell'indice di variabilità relativa: il coefficiente di variazione, chiamato anche deviazione standard relativa. Saranno forniti diversi esempi utili a rendere la teoria molto più chiara. 

Cos'è il coefficiente di variazione?

Gli indici di variabilità relativa servono a confrontare le intensità dello scostamento dalla media (espressi dagli indici di variabilità assoluta, i più comuni varianza e deviazione standard), che si registrano in due rilevazioni statistiche differenti, espresse a loro volta in unità di misura diverse.

Il coefficiente di variazione è quindi utile, in questo senso, perché è un valore puro che non tiene conto dell'unità di misura. In altre parole, il coefficiente di variazione o deviazione standard relativa dà la possibilità di confrontare delle misure relative a fenomeni che sono caratterizzati da unità di misura diverse; per questo il coefficiente di variazione non fa riferimento a nessun tipo di unità di misura.

Coefficiente di variazione: esempi

Il coefficiente di variazione è definito dal rapporto fra deviazione standard e media espressa in valore assoluto: V = s / |x|.

Cosicché, a titolo di esempio, se ho due campioni statistici, uno relativo al peso medio e l'altro relativo all'altezza media di adolescenti compresi tra i 12 e 16 anni e ne ho ricavato la deviazione standard e il valore medio, al posto della deviazione standard posso utilizzare l'indice in questione per confrontare la variabilità, in valore assoluto, delle due rilevazioni rispetto alla media.

Il confronto va quindi effettuato tra i due coefficienti di variazione relativi ad ogni campione rilevato.

Un altro esempio potrebbe essere quello in cui abbiamo due tipi di distribuzioni, la prima è A e la seconda è B. A misura il reddito dell'Unione Europea mentre B quello degli Stati Uniti d'America. In entrambi i dati vengono usate due unità di misura diverse, nel primo caso l'euro e nel secondo il dollaro.

Per tutte e due le distribuzioni si calcolerà il reddito medio (attraverso una semplice media aritmetica) e la devianza standard (quindi la dispersione assoluta).

Gli indicatori di dispersione, per via delle diverse unità di misura, non possono essere confrontati. Pertanto bisognerà calcolare, innanzitutto, la dispersione relativa. Successivamente, per entrambe le distribuzioni si calcolerà il coefficiente di dispersione o di variazione. Alla fine dei calcoli risulterà che i coefficienti di variazione saranno tra loro comparabili.

Tuttavia, il coefficiente di variazione non è adatto ad indicare la variabilità di un campione quando la media assume valore 0 o quando la variabilità rispetto al valore medio è nulla. Infatti, nel primo caso il risultato del rapporto (deviazione standard / media in valore assoluto) sarebbe un numero infinito, nel secondo caso non ha senso eseguire un confronto di variabilità semplicemente perché questa non sussiste in una (o in entrambi) le rilevazioni statistiche.

Indici assoluti e indici relativi

Gli indici di variabilità misurano, appunto, il livello di variabilità di un carattere.

Ne esistono di due tipi:

  1. gli indici assoluti;
  2. gli indici relativi.

I primi dipendono dall'unità di misura del carattere e comprendono:

  • il campo di variazione (o range), che si indica con Cv ed è uguale a Xmax - Xmin (il risultato della differenza tra il valore osservato più grande e il valore osservato più piccolo);
  • le differenze medie, semplici o quadratiche, che consistono nel considerare le differenze tra ogni termine e tutti gli altri. Quando si includono nel calcolo anche le differenze (nulle) di ogni termine con se stesso, le differenze medie si definiscono "con ripetizione". Si indicano con Delta;
  • lo scostamento quadratico medio, cioè la media quadratica degli scarti dalla media aritmetica. Si indica con sigma;
  • la varianza, cioè il quadrato dello scostamento quadratico medio. Il numeratore della varianza si chiama "devianza". La varianza si indica con sigma quadro.

Consigli

Alcuni link che potrebbero esserti utili:

Contenuto sponsorizzato: Studenti.it presenta prodotti e servizi che si possono acquistare online su Amazon e/o su altri e-commerce. Ogni volta che viene fatto un acquisto attraverso uno dei link presenti in pagina, Studenti.it potrebbe ricevere una commissione da Amazon o dagli altri e-commerce citati. Vi informiamo che i prezzi e la disponibilità dei prodotti non sono aggiornati in tempo reale e potrebbero subire variazioni nel tempo, vi invitiamo quindi a verificare disponibilità e prezzo su Amazon e/o su altri e-commerce citati

Un consiglio in più