ANALISI DEI DATI

moda, media ,mediana, varianza, covarianza, correlazione, tabelle a doppia entrata, ... (18 pagine formato doc)

Appunto di puccie1
ANALISI DEI DATI ANALISI DEI DATI Esistono 2 tipologie differenti di dati: QUALITATIVI e QUANTITATIVI.
I dati qualitativi sono espressi in forma verbale, dando origine a classificazioni in categorie. I dati quantitativi sono legati a quantità numeriche. QUANTITATIVO DISCRETO: possono assumere un numero finito o infinito ma numerabile di valori QUANTITATIVO CONTINUO: può assumere un'infinità non numerabile di valori DISTRIBUZIONI DI FREQUENZA UNIDIMENSIONALI Per i dati QUANTITATIVI DISCRETI e QULITATIVI ORDINALI si associa a ciascuna modalità o categoria il numero di volte in cui compare nei dati: questo numero è la FREQUENZA ASSOLUTA O NUMEROSITA. L'insieme delle modalità e delle loro frequenze difinisce la DISTRIBUZIONE DI FREQUENZA.
Date N categorie x1, x2, xn… i indicati con x1*, x2*…xn* i valori diversi fra loro presenti in esse, la distribuzione di frequenza è: MODALITA FREQEUNZE ASSOLUTE X1* n1 X2* n2 … … Xk* nk Dove ni indica la frequenza assoluta o numerosità di X1*. ?ni = N Dove N è il numero delle unità classificate. Si definisce FREQUENZA RELATIVA della modalità Xi* il rapporto tra la frequenza assoluta ni e il numero complessivo delle osservazioni effettuate N, cioè Pi = ni N Si ha che ?pi = ? ni = 1/N ?ni = 1/N N = 1 N Anche l'insieme delle modalità e delle frequenze relative viene detto distribuzione di frequenza e viene rappresentato come: MODALITA FREQUENZE RELATIVE X1* p1 X2* p2 … … Xk* pk Se si dispone delle numerosità il contenuto informativo è maggiore. Le distribuzioni di frequenza possono essere rappresentate attraverso dei grafici. Per i dati QUALITATIVI si utilizzano i DIAGRAMMI A BARRE e i diagrammi a TORTA. Nei diagrammi a barre vengono indicate sull'asse orizzontale le CATEGORIE della variabile, mentre sull'asse verticale vengono indicate la FREQUENZA ASSOLUTA o RELATIVA corrispondente alle diverse modalità. Un altro tipo di rappresentazione grafica quella dei DIAGRAMI A TORTA. Per determinare l'angolo rispetto al centro di ciascun taglio ?i, bisogna impostare la proporzione: ?i = pi x 360 ?i = ni x 360 N Nel caso di caratteri QUANTITATIVI DISCRETI la distribuzione grafica avviene attraverso il DIAGRAMMA DELLE FREQUENZE; l'asse orizzontale ha un significato quantitativo, segnalando i valori assunti dalla variabile discreta. TABELLA3 FAMIGLIA NUMERO COMPONENTI 1 3 2 4 3 5 4 6 5 3 6 2 7 3 8 4 9 3 10 2 Figura 3 4 3 2 1 0 2 3 4 5 6 DISTRIBUZIONI DI FREQUENZA PER CARATTERI QUANTITATIVI CONTINUI Nel caso di variabili quantitative continue è utile riclassificare le variabili in classi intervallari Esiste il problema di stabilire l'ampiezza degli intervalli; in assenza di indicazioni si adottano o intervalli di AMPIEZZA COSTANTE o intervalli di AMPIEZZA DIVERSA, ma aventi tutti la stessa frequenza. Se suggerisce di scegliere un numero di intervalli compreso tra 5 e 20. Tabella4 ESTREMI INFERIORI DELLE CLASSI X*i ESTREMI SUPERIRI DELLE CLASSI X*i+1 AMPIEZZA INTERVALLO ?i FREQEUNZE ASSOL