Come calcolare la devianza

Sai cos'è la devianza in statistica? E come si trova? Ecco la definizione, la formula da applicare e un esempio di calcolo

Come calcolare la devianza
getty-images

Come si calcola la devianza: introduzione

Statistica: come calcolare la devianza
Fonte: getty-images

La devianza costituisce un indice di dispersione dei dati, il quale determina la somma dei quadrati degli scarti della media di una variabile rappresentante una distribuzione di dati.

In termini più semplici, essa fornisce un grado di dispersione di una certa variabile dal proprio valore mediano.

Oltre ad essere un indicatore statistico, la devianza viene adoperata anche per calcolare ulteriori indici di dispersione estremamente utili (come la varianza e lo scarto quadratico medio).

Nella seguente guida vi spieghiamo come si calcola la devianza, quali formule matematiche sono necessarie da applicare e un esempio.

Occorrente: Variabile "X"; "N" valori.

Trovare il medio

Il calcolo della devianza (somma dei quadrati degli scarti della media di una determinata variabile) è molto facile da fare e bisognerà ipotizzare di avere una variabile "X" rappresentante una distribuzione di dati che potrebbero assumere "N" valori.

Innanzitutto, sarà necessario trovare il valore medio della seguente distribuzione dei dati (indicato come "Xm"), il quale costituisce la media aritmetica dei valori assunti dalla "X" e si calcola come la somma degli "N" valori divisi per il numero dei valori "N".

Montare i parametri

Qui vengono indicati i valori montati dai parametri nel modello M0. Mentre i parametri montati per il modello saturo vengono entrambi applicati ai set di valori montati.

Quindi sono implicitamente funzioni delle osservazioni y. Qui, il modello saturato è un modello con un parametro per ogni osservazione. In questo modo i dati si installano esattamente.

Per calcolare la devianza bisogna applicare due volte il rapporto del logaritmo del modello, ma bisogna applicare quello ridotto rispetto al modello completo.

La devianza viene utilizzata per confrontare due modelli, in particolare, nel caso di modelli lineari generalizzati (GLM) dove ha un ruolo simile alla varianza, ma si tratta comunque di varianza residua da ANOVA nei modelli lineari (RSS).

Supponiamo che nel quadro del GLM troviamo due modelli nidificati. Quindi M1 e M2. In particolare, supponiamo che M1 contenga i parametri in M2 e k parametri aggiuntivi. A questo punto calcolare la devianza sarà una passeggiata.

Determinare le differenze

Dopodiché, sarà necessario determinare le differenze fra ciascun valore di "X" e la media "Xm", ottenendo "D1 = 3 - 28,8 = -25,8", "D2 = 9 - 28,8 = -19,8", "D3 = 33 - 28,8 = 4,2", "D4 = 34 - 28,8 = 5,2" e "D5 = 65 - 28,8 = 36,2".

Successivamente, si dovranno trovare i quadrati delle differenze e così si otterrà "Q1 = D1² = 665,64", "Q2 = D2² = 392,04", "Q3 = D3² = 17,64", "Q4 = D4² = 27,04" e "Q5 = D5² = 1310,44".

Adesso sarà finalmente possibile determinare la devianza, effettuando la somma dei quadrati appena ottenuti: in questo modo, si avrà "D = Q1 + Q2 + Q3 + Q4 + Q5 = 2412,8".

Altri contenuti di statistica

Un aiuto extra per il tuo studio

Studia più in fretta con questi manuali:

Contenuto sponsorizzato: Studenti.it presenta prodotti e servizi che si possono acquistare online su Amazon e/o su altri e-commerce. Ogni volta che viene fatto un acquisto attraverso uno dei link presenti in pagina, Studenti.it potrebbe ricevere una commissione da Amazon o dagli altri e-commerce citati. Vi informiamo che i prezzi e la disponibilità dei prodotti non sono aggiornati in tempo reale e potrebbero subire variazioni nel tempo, vi invitiamo quindi a verificare disponibilità e prezzo su Amazon e/o su altri e-commerce citati

Un consiglio in più