La variabilità in Statistica
Il concetto di variabilità, i principali indici e come calcolarli. Lo studio della variabilità è una parte molto importante di ogni analisi statistica. Lo scopo è di riassumere in pochi valori tutta l'informazione contenuta nella distribuzione (8 pagine formato doc)
LEZIONE 6 LEZIONE 6LA VARIABILITA' In questa lezione introdurremo il concetto di variabilità, parleremo dei principali indici ed impareremo a calcolarli.
Lo studio della variabilità è una parte molto importante di ogni analisi statistica; il nostro scopo rimane quello di riassumere in pochi valori tutta l'informazione contenuta nella distribuzione. Avevamo, a tal proposito, visto ed utilizzato le medie, ma queste non risolvono tutti i nostri problemi. Per capire meglio quanta parte di informazione venga tagliata fuori dalle medie vediamo il seguente esempio in cui osserveremo due distribuzioni diverse ma con la stessa media. X1 =5 X2 =4 X3 =3 X4 =7 X5 =11 X1 =6 X2 =6 X3 =6 X4 =7 X5 =5 E' evidente che per entrambe le distribuzioni la media aritmetica è 6 ma è altrettanto evidente che le due distribuzioni sono molto diverse; in particolare la seconda distribuzione presenta delle modalità più vicine alla media. Le informazioni fornite dallo studio della variabilità ci danno una misura del grado di dispersione delle modalità rispetto alla media. In particolare la variabilità misura la diversità fra le modalità di un fenomeno. Si possono considerare tre tipi distanze: fra ogni termine della distribuzione e la media; fra i termini della distribuzione; fra particolari termini della distribuzione. Per valutare la distanza fra ogni elemento della distribuzione e la media useremo gli scostamenti medi; per le distanze fra i vari elementi della distribuzione calcoleremo le differenze medie ed infine per le distanze fra particolari elementi della distribuzione utilizzeremo gli intervalli di variazione. Per tutte le applicazioni che di seguito vedremo consideriamo la seguente distribuzione di frequenze: Tabella 1 Scostamenti medi Come già detto, con gli scostamenti vado a studiare la distanza fra ogni elemento della distribuzione e una qualsiasi media, che in questo contesto indicheremo con M. In particolare lo scostamento medio di ordine r da M per la distribuzione di frequenze vista è calcolabile attraverso la seguente relazione: Importante proprietà di tale scostamento è la seguente: rSM >= 0 Dando all'indice r particolari valori, si ottengono particolari tipi di scostamenti: Scostamenti semplici medi Questo tipo di scostamento si ottiene, semplicemente ponendo nella formula generale rSM il valore r = 1 . Come al solito, nella formula indicheremo con M una generica media, o meglio, un generico centro; in particolare calcolando lo scostamento dalla mediana Me si ottiene il più piccolo degli scostamenti semplici medi. Nel caso in cui il carattere sia diviso in classi, per calcolare tutti gli scostamenti si dovrà far riferimento al valore centrale della classe (assumendo, come si è fatto per il calcolo delle medie, che tutte le unità all'interno della classe pr