Test statistici
I test statistici sono dei procedimenti decisionali che, a partire dai dati statistici osservati di un certo fenomeno, consentono di
· stabilire se una determinata ipotesi è (plausibilmente) vera o falsa, cioè se i dati osservati sostengono o meno l’ipotesi che il ricercatore intende sottoporre a verifica
SOMMARIO
Principi fondamentali dei test statistici
Test sulla
normalità (Normality Test)
Test t su
misure ripetute (Paired t)
Test sulla
varianza (2-Variances)
I test statistici appartengono a quel ramo delle scienze statistiche chiamato inferenza statistica. Questa disciplina ha come origine il presupposto che le osservazioni statistiche di un qualsiasi fenomeno sono la manifestazione di un processo sottostante al fenomeno stesso e che ne regola la sua realizzazione in termini probabilistici. L’obiettivo dell’inferenza è di dedurre delle informazioni da ciò che è noto (campione) verso ciò che è ignoto (popolazione).
Possiamo perciò considerare l’insieme delle osservazioni statistiche di un certo fenomeno come un campione dell’intera popolazione che viene quindi definita dall’insieme di tutte le ipotetiche possibili osservazioni del fenomeno stesso.
Una popolazione si caratterizza per una certa funzione di densità di probabilità cioè una legge che associa le possibili manifestazioni del fenomeno alla probabilità che esse si manifestino. La distribuzione e l’istogramma di frequenza, generati dalle osservazioni campionarie di in certo fenomeno, sono espressioni della natura probabilistica della popolazione, cioè della sua funzione densità di probabilità.
L’inferenza statistica si occupa di dedurre delle informazioni sull’intera popolazione a partire dal un suo campione statistico che è naturalmente la fonte privilegiata di informazione sulla caratteristiche essenziali della popolazione, che consistono nella
1. media
2. varianza
3. funzione di densità
Il punto di partenza dell’inferenza statistica è dato dalla cosiddetta stima cioè il calcolo dagli indici statistici forniti dalla media aritmetica e dalla varianza (o dalla deviazione standard). Nell’ambito dell’inferenza tali indici, detti anche media e varianza campionaria, sono chiamati anche stimatori e costituiscono dei basilari elementi informativi sulla media e varianza della popolazione, i parametri ignoti della popolazione.
Media e varianza campionaria, stimatori della media e della varianza della popolazione, godono inoltre di alcune importanti proprietà tra cui
1. la correttezza, cioè il valore medio dello stimatore è uguale al vero valore ignoto della popolazione
2. consistenza, cioè all’aumentare della numerosità campionaria il valore dello stimatore converge al vero valore ignoto della popolazione
Notiamo che gli indici statistici sono qui considerati non come singoli valori a sé stanti ma come vere e proprie variabili casuali di diretta derivazione della legge probabilistica che determina il fenomeno statistico.
Concentriamoci sulla media campionaria che è di gran lunga il più importante e, a giusta ragione, anche il maggiormente utilizzato indicatore sintetico di un fenomeno statistico. Se immaginiamo di avere a disposizione una serie di campioni indipendenti provenienti da una certa popolazione e di calcolare per ciascun campione la media campionaria possiamo costruire la distribuzione di frequenza della media campionaria che, grazie al fondamentale teorema del limite centrale, gode della seguente proprietà:
indipendentemente dalla distribuzione di probabilità che regola il comportamento della popolazione, la distribuzione campionaria della media si approssima ad una distribuzione normale con media uguale alla media della popolazione e varianza pari alla varianza della popolazione divisa per la radice quadrata della numerosità campionaria.
Il grado di approssimazione è migliore tanto quanto la numerosità del campione è grande (20-30 è generalmente sufficiente) e tanto più la distribuzione di probabilità della popolazione è simmetrica rispetto alla media.
Da quanto detto segue che l’intervallo
(dove x barrato rappresenta la media campionaria, Z la funzione inversa della funzione di ripartizione della normale cioè il valore x tale che l’area sotto la normale sia pari ad un ammontare prefissato, a è il livello di significatività del test (solitamente 0,05), s e lo standard error del campione ed infine n è la numerosità campionaria)
rappresenta l’intervallo di confidenza di livello a della media della popolazione, cioè quella regione che con probabilità 1-a conterrà il vero valore della media della popolazione.
Con un ragionamento analogo è possibile calcolare l’intervallo di confidenza della varianza e della mediana della popolazione.
Qualsiasi test statistico è contraddistinto da un’insieme di elementi comuni e da un analogo processo decisionale.
Gli elementi comuni del test statistico sono i seguenti:
![]() |
· l’ipotesi nulla è l’ipotesi che il ricercatore vuole sottoporre a verifica, ed è generalmente un’ipotesi che, grazie a delle informazioni a priori, si ritiene essere lo status quo
· l’ipotesi alternativa è l’ipotesi che sarà accettata in caso di rifiuto dell’ipotesi nulla ed è generalmente l’ipotesi che il ricercatore vorrebbe fosse accettata come prova di una nuova teoria
· il livello di significatività è la probabilità di accettare l’ipotesi nulla, anche nel caso essa sia non vera, che il ricercatore è disposto a sopportare (generalmente 0,05)
· la statistica test è una funzione dei dati osservati che ha la caratteristica di distribuirsi secondo una appropriata funzione di probabilità
· il T-value è il valore assunto dalla statistica test sulla base dei dati osservati; esso sarà tanto più grande (per alcuni statistiche test anche più piccolo) quanto più i dati supporteranno il rifiuto dell’ipotesi nulla
· il p-value è il valore dell’area sottostante alla distribuzione di probabilità della statistica test di osservare un valore maggiore od uguale (per alcuni statistiche test anche minore od uguale) al T-value
Dopo aver formulato in maniera opportuna l’ipotesi nulla, l’ipotesi alternativa e il livello di significatività (generalmente 0,05) il processo decisionale che conduce all’accettazione o al rifiuto dell’ipotesi nulla è il seguente
1. a partire dai dati osservati si calcola il T-value
2. al T-value corrisponde un p-value sulla base della distribuzione di probabilità della statistica test
o se il p-value è minore di a Þ si rifiuta l’ipotesi nulla
o se il p-value è maggiore di a ma minore di 0.1 Þ si accetta l’ipotesi nulla con riserva
o se il p-value è maggiore di 0.1 Þ si accetta l’ipotesi nulla
Il livello di significatività a del test indica la probabilità di rifiutare l’ipotesi nulla in caso essa sia vera e rappresenta un necessario compresso che il ricercatore è costretto ad accettare per poter disporre di un metodo in grado di identificare le situazioni nelle quali l’ipotesi nulla non è supportata dall’evidenza delle osservazioni statistiche.
Questo categoria di errore, detto errore di I° TIPO, esprime certamente la situazione meno auspicabile per l’analista dal momento che l’ipotesi H0 si caratterizza per essere l’ipotesi privilegiata, che per essere abbandonata deve dimostrarsi veramente poco probabile dal momento che generalmente tale rifiuto implicherà dei costi (effettivi o almeno concettuali).
L’errore che si commette invece quando si manca di rifiutare l’ipotesi nulla quando essa è falsa viene chiamato errore di II° TIPO e si indica con il simbolo b.
Anche se l’errore di I° TIPO è determinato da una scelta del ricercatore, tale procedura da sola non garantisce certo la capacità del test statistico di essere veramente sempre capace di rilevare la situazione in cui è vera l’ipotesi alternativa H1. Tale proprietà del test è detta potenza del test e si calcola mediante l’operazione 1-b.
La potenza del test dovrebbe essere più alta possibile, tenendo conto che il suo valore limite è pari a 1. La potenza del test, che è quindi la capacità di rifiutare H0 quando essa è falsa, è funzione una serie di parametri caratteristici del test; in particolare:
· all’aumentare della numerosità campionaria
· all’aumentare dell’effetto differenziale tra il vero valore dell’ipotesi alternativa e ipotesi nulla
· al diminuire della varianza popolazione (e quindi anche della varianza campionaria)
· al diminuire del livello di significatività a (cioè a passa, ad esempio, da 0,05 a 0,1)
si ottiene un incremento positivo nella potenza del test. Naturalmente queste proprietà della potenza del test non sono tali da permettere un controllo sulle sue prestazioni ma servono come indicazione per una corretta pianificazione di un esperimento statistico volto a testare una determinata ipotesi nulla. A posteriori invece, noti tutti i parametri del test, è possibile calcolare il valore della potenza del test in modo da rendersi conto della sua efficacia secondo le specifiche in questione.
Questo test permette, una volta noti i veri parametri della popolazione m e s, di testare se il campione a disposizione mostra una media significativamente uguale a quella della popolazione da cui si ritiene esso provenga.
Generalmente questo tipo di test ha il suo principale utilizzo nel controllo dei processi industriali.
A differenza da quanto ipotizzato dal test precedente, è frequente la situazione per la quale non si conosce la vera varianza della popolazione da cui proviene il campione. In questo caso per testare l’ipotesi che il campione abbia una media pari ad un certo valore prefissato, si utilizza questo tipo di test che stima la varianza della popolazione in base alla varianza campionaria.
Tale test ha la funzione di testare se in un certo campione il numero di elementi con una certa caratteristica rispettano statisticamente una proporzione prefissata.
Tale test verifica se il campione in esame mostra o meno la propensione a seguire il modello probabilistico proprio della distribuzione di probabilità normale.
Verifica l’uguaglianza della media di due campioni di cui non si conosce la vera varianza della popolazione da cui provengono.
Nel caso in cui i dati dei due campioni provengano dalle stesse unità statistiche, sulle quali si è rilevata una medesima caratteristica a distanza di tempo, invece del precedente test-t si utilizza questa versione Paired-t che risulta più conservativa dal momento che si ha la certezza che gli elementi provengano dalla stessa popolazione.
Questo test verifica se il numero di elementi di un campione con una certa caratteristica è pari in proporzione al numero di elementi con la stessa caratteristica presenti in un secondo campione.
Si utilizza questo test per verificare se due campioni dimostrano o meno di avere le stessa varianza.