Come calcolare la devianza
Sai cos'è la devianza in statistica? E come si trova? Ecco la definizione, la formula da applicare e un esempio di calcolo
Indice
Come si calcola la devianza: introduzione
La devianza costituisce un indice di dispersione dei dati, il quale determina la somma dei quadrati degli scarti della media di una variabile rappresentante una distribuzione di dati.
In termini più semplici, essa fornisce un grado di dispersione di una certa variabile dal proprio valore mediano.
Oltre ad essere un indicatore statistico, la devianza viene adoperata anche per calcolare ulteriori indici di dispersione estremamente utili (come la varianza e lo scarto quadratico medio).
Nella seguente guida vi spieghiamo come si calcola la devianza, quali formule matematiche sono necessarie da applicare e un esempio.
Occorrente: Variabile "X"; "N" valori.
Trovare il medio
Il calcolo della devianza (somma dei quadrati degli scarti della media di una determinata variabile) è molto facile da fare e bisognerà ipotizzare di avere una variabile "X" rappresentante una distribuzione di dati che potrebbero assumere "N" valori.
Innanzitutto, sarà necessario trovare il valore medio della seguente distribuzione dei dati (indicato come "Xm"), il quale costituisce la media aritmetica dei valori assunti dalla "X" e si calcola come la somma degli "N" valori divisi per il numero dei valori "N".
Montare i parametri
Qui vengono indicati i valori montati dai parametri nel modello M0. Mentre i parametri montati per il modello saturo vengono entrambi applicati ai set di valori montati.
Quindi sono implicitamente funzioni delle osservazioni y. Qui, il modello saturato è un modello con un parametro per ogni osservazione. In questo modo i dati si installano esattamente.
Per calcolare la devianza bisogna applicare due volte il rapporto del logaritmo del modello, ma bisogna applicare quello ridotto rispetto al modello completo.
La devianza viene utilizzata per confrontare due modelli, in particolare, nel caso di modelli lineari generalizzati (GLM) dove ha un ruolo simile alla varianza, ma si tratta comunque di varianza residua da ANOVA nei modelli lineari (RSS).
Supponiamo che nel quadro del GLM troviamo due modelli nidificati. Quindi M1 e M2. In particolare, supponiamo che M1 contenga i parametri in M2 e k parametri aggiuntivi. A questo punto calcolare la devianza sarà una passeggiata.
Determinare le differenze
Dopodiché, sarà necessario determinare le differenze fra ciascun valore di "X" e la media "Xm", ottenendo "D1 = 3 - 28,8 = -25,8", "D2 = 9 - 28,8 = -19,8", "D3 = 33 - 28,8 = 4,2", "D4 = 34 - 28,8 = 5,2" e "D5 = 65 - 28,8 = 36,2".
Successivamente, si dovranno trovare i quadrati delle differenze e così si otterrà "Q1 = D1² = 665,64", "Q2 = D2² = 392,04", "Q3 = D3² = 17,64", "Q4 = D4² = 27,04" e "Q5 = D5² = 1310,44".
Adesso sarà finalmente possibile determinare la devianza, effettuando la somma dei quadrati appena ottenuti: in questo modo, si avrà "D = Q1 + Q2 + Q3 + Q4 + Q5 = 2412,8".
Altri contenuti di statistica
- Come fare una semplice analisi statistica dei dati con Excel
- Statistica: spiegazione e concetti di base. Formule, definizioni
- Come si calcola il coefficiente di variazione in statistica
Un aiuto extra per il tuo studio
Studia più in fretta con questi manuali: