Come verificare se la distribuzione di una serie di dati è normale
Come si fa a capire se una distribuzione è normale in statistica? Ecco la guida che ti spiega passo passo come verificarlo in modo semplice e veloce con Excel
Indice
Introduzione
In moltissimi settori, dall'industria all'economia, fino ai molteplici esperimenti scientifici, occorre spesso effettuare dei test statistici. I test statistici sono spesso finalizzati alla verifica dell'aleatorietà dell'incertezza legata alle misure sperimentali.
Infatti, se i dati hanno una distribuzione normale (o gaussiana), l'incertezza sulle misurazioni è dovuta solo ad errori casuali. In questo modo è possibile verificare se sono presenti errori sistematici ed eventualmente correggerli nel modo più opportuno.
La distribuzione normale è caratterizzata da un valore centrale e da una deviazione standard. Vediamo ora insieme, in questa guida, come verificare se la distribuzione di una serie di dati sia normale o meno.
Occorrente: Microsoft Excel, serie di dati e calcolatrice.
Premessa
Iniziamo da subito con una premessa: la statistica è una scienza di derivazione matematica e si occupa di descrivere e studiare la realtà che ci circonda in tutti i suoi aspetti di rilevanza numerica, per darne poi una interpretazione oggettiva.
Nello studio di un campione è indispensabile che questo rifletta le caratteristiche della popolazione, in questo modo tutti gli individui facenti parte di quest'ultima avranno la stessa probabilità di essere selezionati.
Lo studio dei dati
Per descrivere nel modo più corretto il nostro campione è necessario raccogliere alcuni dati che andremo ad inserire in tabelle dedicate per poterli analizzare al meglio, quindi trarre le corrette conclusioni.
Per descrivere la misura effettuata sul campione di riferimento (variabile) bisogna indicare il valore che al meglio caratterizza il campione stesso: la moda. Ovvero, il dato che più volte abbiamo ottenuto durante il nostro sondaggio, il nostro esperimento scientifico, oppure la nostra indagine.
Fatto questo, sarà necessario descrivere come gli altri dati raccolti si distribuiscono attorno a questo valore, e qui potremo ottenere due casi differenti: i dati potranno, infatti, essere simmetrici rispetto a questo valore, oppure potranno non esserlo.
Conclusione
Per verificare se questi dati siano simmetrici (standardizzati o normali) o meno, è sufficiente una semplice operazione: utilizzare le funzioni MEDIA, MEDIANA e ASIMMETRIA di Microsoft Excel, contenuto nel pacchetto Office di Windows, (ma ci sono anche altri software con fogli di calcolo facilmente reperibili sulla rete anche in modo gratuito).
Si deve quindi selezionare una cella, poi dal menu in alto "Formule" premere su "Inserisci funzione", qui troveremo una lunghissima lista di formule tra le quali ci sarà sicuramente quella che di cui abbiamo bisogno in questo caso. Una volta selezionata, il programma ci darà, in una nuova cella, il risultato desiderato.
Risultati possibili
Una volta calcolati i tre risultati (media, mediana e asimmetria) possiamo affermare di aver ottenuto una distribuzione normale se: la media corrisponderà al valore della mediana, e l'asimmetria risulterà compresa tra il valore -2 e +2 (si considera "distribuzione normale" anche una serie la cui media non è esattamente coincidente con la mediana, ma che presenta un'asimmetria compresa tra i valori -2 e +2).
Potete verificare il risultato anche visivamente, poiché il grafico di una distribuzione normale ha la forma classica di una campana, dove il valore centrale corrisponde a media e mediana. Detto in parole povere, questo sarà il valore che avrà la colonnina più alta, nel caso stessimo lavorando con un diagramma a colonne oppure con un istogramma.
Questo tipo di configurazione viene anche chiamato "Campana di Gauss" o "gaussiana" proprio per la forma a campana che assume il grafico.
Consigli
Non dimenticare mai:
- di ripassare le basi di statistica.
Alcuni link che potrebbero esserti utili:
- Come calcolare la distribuzione marginale
- Appunti di economia aziendale: la curva di Lorenz
- Come calcolare la tangente e la normale ad una curva