cerca

Formulario di statistica descrittiva

Riportiamo alcune definizioni prima di riepilogare le principali formule della stastistica descrittiva.

Popolazione statistica: l’insieme degli elementi che sono oggetto di una indagine statistica, ovvero l’insieme delle unità, dette unità statistiche o individui di una popolazione, sulle quali viene effettuata la rilevazione di una certa caratteristica.

Carattere o variabile: una proprietà che si possa osservare o studiare in ogni individuo. Se i caratteri misurati si possono esprimere in termini numerici vengono detti quantitativi, altrimenti qualitativi. Se il carattere è quantitativo la caratteristica si chiama variabile statistica o aleatoria, se il carattere è qualitativo la caratteristica si chiama mutabile statistica.

Campione statistico: definita una popolazione statistica, per campione di grandezza n si intende un insieme finito di n individui della popolazione. Affinchè un campione possa ritenersi rappresentativo per l'intera popolazione, è necessario supporre che il campione sia casuale (random), ossia che ogni individuo della popolazione abbia la stessa probabilità di essere scelto per far parte del campione.

Rilevazione campionaria: una rilevazione fatta su un campione statistico che sia utile per desumere informazioni relative all'intera popolazione.

Riportiamo ora una serie di formule e definizioni riferite ad operazioni che si possono effettuare su una serie di dati, ossia un campione, del tipo Studenti/matematica.

Frequenza assoluta: il numero di osservazioni registrate per ogni elemento del campione.

Frequenza relativa:

Studenti/matematica

La frequenza relativa è compresa nell’intervallo [0, 1].

Frequenza percentuale:

Studenti/matematica

Media campionaria o aritmetica:

Studenti/matematica

Scarti dalla media: le differenze Studenti/matematica tra i valori Studenti/matematica e la loro media campionaria Studenti/matematica.

Alcune proprietà della media

La somma degli scarti è nulla

Studenti/matematica

La media minimizza la somma dei quadrati degli scarti infatti qualunque sia il numero Studenti/matematica si ha:

Studenti/matematica

Siano Studenti/matematica ed Studenti/matematica rispettivamente il minimo ed il massimo dei valori della serie Studenti/matematica, si ha

Studenti/matematica

Moda: l’elemento (o gli elementi) a cui corrisponde la massima frequenza assoluta.

Mediana: il valore centrale della serie, cioè il valore che occupa il posto Studenti/matematica nella serie se Studenti/matematica è dispari o la media dei valori che occupano i posti Studenti/matematica ed Studenti/matematica se Studenti/matematica è pari.

Media geometrica: il numero positivo

Studenti/matematica

Media armonica: il numero positivo

Studenti/matematica

Media quadratica: il numero

Studenti/matematica

Range o campo di variazione: la differenza tra il massimo e il minimo dei valori della serie:

Studenti/matematica

Scarto semplice medio: il numero non negativo

Studenti/matematica

dove Studenti/matematica è la media degli elementi del campione e le quantità Studenti/matematica rappresenta gli scarti.

Scarto quadratico medio (o deviazione standard campionaria): il numero non negativo

Studenti/matematica

Varianza campionaria: il quadrato dello scarto quadratico medio

Studenti/matematica

in letteratura si trovano definizioni alternative, ad esempio le seguenti due

Studenti/matematica
Studenti/matematica

Quartili: quei valori che ripartiscono la popolazione in quattro parti di uguale numerosità. Nota: il secondo quartile coincide con la mediana, e divide la popolazione in due parti di uguale numerosità, delle quali il primo ed il terzo quartile sono le mediane.

Scarto interquartile (Studenti/matematica): la differenza tra il terzo e il primo quartile, ovvero l'ampiezza della fascia di valori che contiene la metà “centrale” dei valori osservati:

Studenti/matematica

Statistica bivariata.

Quando si osservano due caratteri diversi, Studenti/matematica e Studenti/matematica, riferiti ad una medesima popolazione, dei quali conosciamo i valori numerici Studenti/matematica e Studenti/matematica, si può fare riferimento ad indici statistici che possono descrivere come i due insiemi di dati variano tra loro.

Covarianza campionaria:

Studenti/matematica
1

dove Studenti/matematica e Studenti/matematica sono le medie campionarie delle due serie di dati.

Coefficiente di correlazione (o indice di correlazione di Pearson): il valore numerico

Studenti/matematica
2

dove Studenti/matematica indica la covarianza di Studenti/matematica e Studenti/matematica e Studenti/matematica e Studenti/matematica indicano, rispettivamente, la deviazione standard campionaria di Studenti/matematica e Studenti/matematica.

Il coefficiente di correlazione è un indice sempre compreso tra -1 ed 1. Inoltre valgono le seguenti proprietà

  • se Studenti/matematica, le serie di dati Studenti/matematica e Studenti/matematica si dicono direttamente correlate

  • se Studenti/matematica, le serie di dati Studenti/matematica e Studenti/matematica si dicono non correlate

  • se Studenti/matematica, le serie di dati Studenti/matematica e Studenti/matematica si dicono inversamente correlate

  • Studenti/matematica se e solo se i punti sono tutti perfettamente allineati sulla stessa retta

Funzione di densità: una distribuzione statistica Studenti/matematica in cui Studenti/matematica rappresenta la variabile statistica e Studenti/matematica la frequenza relativa, passando dal discreto al continuo, si può scrivere come Studenti/matematica; l’area Studenti/matematica racchiusa tra la curva cartesiana Studenti/matematica, l’asse delle ascisse Studenti/matematica, le ordinate innalzate dai punti di ascissa Studenti/matematica e Studenti/matematica rappresenta la frazione di unità statistiche nella quale il carattere assume valori compresi tra Studenti/matematica e Studenti/matematica; facendo tendere l’intervallo finito Studenti/matematica all’infinitesimo Studenti/matematica (differenziale), la Studenti/matematica definisce la “densità di frequenza” in Studenti/matematica della variabile aleatoria Studenti/matematica viene perciò detta funzione di densità. La frequenza relativa dei valori della variabile statistica o aleatoria entro l’intervallo finito Studenti/matematica misura la probabilità che la Studenti/matematica assuma un valore interno all’intervallo e si calcola con l’integrale definito

Studenti/matematica
Vai alla lezione