Cos'è la statistica: formule, definizioni, spiegazione

Cos'è la statistica, cosa si intende per studio quantitativo e qualitativo dei fenomeni collettivi. Definizione e spiegazione dei concetti di base

Cos'è la statistica: formule, definizioni, spiegazione
istock

Cos'è la statistica

Cos'è la statistica e cosa studia
Fonte: istock

La statistica studia un fenomeno con lo scopo di metterne in evidenza gli aspetti essenziali, risalendo eventualmente alle leggi che lo regolano. Nella maggior parte dei casi rappresenta il mezzo più efficace per ridurre il margine di incertezza delle nostre scelte. Il metodo statistico era usato anche nell’antichità ed ha avuto il suo maggior sviluppo nella seconda metà del 1800.

Problemi con la matematica? Spiegazioni ed esercizi svolti del 5° anno

L'indagine statistica

Il primo problema che ci si pone in una indagine statistica è in relazione a quale aspetto, chiamato carattere, del fenomeno bisogna indagare. Il secondo problema da affrontare è quello di identificare con precisione la popolazione, cioè le persone alle quali fare domande su questo carattere. Ogni elemento della popolazione è definito unità statistica.

I possibili modi con cui si può presentare un carattere sono detti modalità. Quindi un’indagine statistica si può riassumere nelle seguenti 3 fasi:

  • individuare uno o più caratteri sui quali acquisire informazioni;
  • individuare le unità statistiche portatrici del carattere;
  • individuare le modalità in cui il carattere si può presentare.

Caratteri della statistica

Si può fare una prima distinzione fra due tipi di caratteri: quelli qualitativi, le cui modalità sono generalmente espresse da aggettivi o nomi, e quelli quantitativi, le cui modalità sono espresse tramite numeri. I caratteri qualitativi si possono classificare in sconnessi (relazioni di diversità, ad esempio il colore dei capelli) e ordinati (relazioni d’ordine, ad esempio il grado d’istruzione). I caratteri quantitativi, invece, si possono classificare in discreti (insieme finito o infinito numerabile, ad esempio il numero dei componenti di una famiglia) e contigui (carattere espresso con un numero reale, ad esempio l'altezza di un certo gruppo di individui).

Matematica, gli errori più comuni

Dati statistici

Fatte queste prime distinzioni, rimane il problema di raccogliere i dati necessari all’indagine. Alcuni tipi di indagine statistica richiedono il contributo di tutta la popolazione. Per altri tipi di indagine, l’analisi di tutta la popolazione risulta troppo dispendiosa in tempo, denaro e numero di persone addette. Risulta però necessario ricorrere ad un suo sottoinsieme, denominato campione, i cui elementi siano in qualche modo rappresentativi dell’intera popolazione. Una volta scelto il campione, resta da stabilire come raccogliere le informazioni (tramite interviste e/o sondaggi). Eseguita la raccolta dei dati, occorre procedere al loro spoglio per poterli organizzare in modo che essi diano informazioni sintetiche sul fenomeno che si sta analizzando, cioè occorre contare quante unità statistiche del campione presentano una certa modalità del carattere osservato. Il numero che ne risulta prende il nome di frequenza assoluta di quella modalità.

Bravi in matematica ci si diventa, lo dicono gli esperti

L’insieme delle coppie ordinate (modalità, frequenza assoluta) si dice distribuzione di frequenze, cioè una funzione che può essere rappresentata elencandone tutte le coppie organizzate in una tabella. Accanto alla colonna delle frequenze assolute si è soliti riportare anche le frequenze relative, intese come rapporto fra la frequenza assoluta ed il numero totale delle osservazioni.

In base al tipo di carattere rappresentato, le distribuzioni di frequenza prendono il nome di:

  • mutabile statistica, se il carattere è di tipo qualitativo;
  • variabile statistica, se il carattere è di tipo quantitativo.

Il modo più semplice per elaborare un insieme da dati statistici è quello di rappresentarli graficamente, ad esempio con diagrammi a rettangoli distanziati, diagrammi circolari, ideogrammi, cartogrammi, diagrammi cartesiani o istogrammi.

Come diventare bravi in matematica

La media

Avere raccolto dei dati, averli organizzati e averne dato una rappresentazione grafica non è spesso sufficiente quando si devono fare dei confronti fra diverse situazioni. Ci sono diversi modi per calcolare e definire un valore medio, o semplicemente media. Secondo la definizione di Lagrange, si dice media di un insieme di n grandezze, fra loro omogenee, disposte in ordine crescente, un qualunque valore che sia compreso fra il valore più piccolo e quello più grande delle grandezze considerate. Secondo la definizione di Chisini, si dice media di un insieme di n grandezze omogenee, in vista della valutazione di una certa funzione f, la quantità x che, sostituita alle grandezze xi soddisfa la relazione: f(x1, x2, xn) = f(x, x, x). Si dice media aritmetica fra n numeri, il rapporto M fra la loro somma ed n: M = (x1 + x2 + ... + xn)/n. La media aritmetica rappresenta quel valore che, sostituito a ciascuna delle osservazioni, non altera la loro somma. Una delle proprietà della media aritmetica è che lo scarto della media, cioè la differenza fra il valore osservato e la media stessa, quindi la somma degli scarti dalla media, è sempre nulla e la somma dei quadrati degli scarti dalle media aritmetica è minima.

Come sopravvivere ad una interrogazione

Media geometrica

Si dice media geometrica semplice fra n numeri positivi e si indica con MG la radice n-esima del loro prodotto. La media geometrica è dunque quel valore che, sostituito ad ogni dato, non altera il loro prodotto. Si dice media quadratica semplice fra n numeri e si indica con MQ la radice quadrata della media aritmetica dei quadrati dei dati. Si dice media armonica semplice fra n numeri e si indica con MA, il reciproco della media aritmetica dei reciproci dei dati.

Tecniche di memoria per studiare svelto e bene

MODA O VALORE MODALE - Si dice moda, o valore modale, di una distribuzione di frequenza il termine, se esiste, cui corrisponde la massima frequenza nella distribuzione. Si definisce mediana di una distribuzione di frequenza il termine che, disposti i dati in ordine crescente (oppure decrescente), occupa il posto centrale. La mediana ha un’importante proprietà, cioè la somma dei valori assoluti degli scarti dalla mediana è minima.

Le medie, la moda e la mediana sono utili come valori di sintesi di una distribuzione o per confrontare distribuzioni diverse. Non danno informazioni sulla variabilità dei dati, dove con questo termine si intende la tendenza che hanno i dati ad essere diversi uno dall’altro. Tale variabilità è data dalla differenza tra il valore più piccolo e quello più grande: ciò viene definito campo di variabilità ed è un numero positivo espresso nella stessa unità di misura dei dati.

Nello studio della variabilità può essere presente un valore fissato detto polo che di solito coincide o con la media aritmetica o con la mediana. Nel caso in cui il polo è uguale alla mediana, è opportuno calcolare lo scostamento medio; se, invece, coincide con la media aritmetica, sarà opportuno calcolare lo scarto quadratico medio. Si definisce scostamento medio la media aritmetica dei valori assoluti degli scarti dalla mediana. Si definisce invece scarto quadratico medio la media quadratica degli scarti dalla media aritmetica.

Come andare bene a scuola

Studiare la concentrazione

Studiare la concentrazione significa stabilire quale percentuale di un certo bene si concentra su una certa percentuale di popolazione. Data la distribuzione di un certo bene, si parla di:

  • equidistribuzione se esso si ripartisce in parti uguali fra gli elementi della collettività; il grafico corrispondente è la retta bisettrice del primo quadrante;
  • massima concentrazione se esso si concentra su un solo individuo della collettività e tutti gli altri o non ne possiedono o ne possiedono quantità talmente basse da poterle considerare nulle; il grafico di massima concentrazione è la spezzata OAB, dove O è l’origine degli assi, A è il punto (100, 0), B è il punto (100,100);
  • concentrazione variabile se esso si ripartisce in modo non uniforme fra gli elementi della collettività; il grafico è una spezzata che esce dall’origine e termina nel punto (100, 100).

La retta di equidistribuzione e la curva di concentrazione (variabile o massima) passano entrambe per l’origine degli assi e per il punto (100, 100). La parte di piano da essa racchiusa prende il nome di area di concentrazione. La retta di equidistribuzione e la curva di concentrazione (variabile o massima) è un triangolo rettangolo che rappresenta quindi l’area di concentrazione massima. Il rapporto fra l’area di concentrazione e l’area di concentrazione massima viene definito rapporto di concentrazione.

Un consiglio in più