Esempio 3
Segue dall’Esempio 1 e 2
Come naturale estensione delle tecniche di inferenza statistica del test a due campioni l’analisi della varianza ci permette di estendere e sviluppare l’indagine statistica alla ricerca di tutte le interrelazioni esistenti tra le variabili in gioco nella determinazione della crescita e dello sviluppo della pianta Poplar.
Prima di procedere con l’analisi della varianza ad una via vera e propria cerchiamo di capire la rilevanza delle diverse variabili di stratificazione nella determinazione dei valori medi di Weigth.
A questo scopo utilizziamo il grafico Main Effect Plot:
ü Stat > ANOVA > Main Effect Plot
ü Response=Weight
ü Factors= Site Treatment 'Year&Age'
ü
OK
Ribadiamo che Site e Treatment sono dei veri e propri fattori mentre Year&Age č una variabile di stratificazione che sottindente, oltre all’etŕ della pianta, dei fattori forse non debitamente misurati.
Come abbiamo giŕ appreso dall’esempio 1 e 2 la variabile Site si mostra ininfluente ai fini della comprensione della variabilitŕ di Weight mentre Treatment e Year&Age presentano delle medie notevolmente diverse dalla media globale per almeno uno dei propri livelli.
Dopo questa premessa cominciamo con l’analisi della varianza ad una via vera e propria.
Per prima cosa confermiamo la bontŕ della stratificazione del nostro campione in base alle 4 combinazioni delle variabili Year e Age: nel caso in cui sulla base dell’analisi della varianza i valori medi della variabile Weigth si dimostreranno significativamente diversi tra loro, allora i 4 sottocampioni saranno strati molto significativi al fine di meglio capire le cause della variabilitŕ della variabile risposta.
A partire dal worlsheet principale Poplar.mtw, la procedura č la seguente:
ü Stat > ANOVA > One-way
ü Response=Weight
ü Factor=Year&Age
ü Clic su Comparison, attivare l’opzione Tukey’s e Fisher; OK
ü Clic su Graph, attivare l’opzione Boxplots of data; OK
ü
OK
One-way ANOVA: Weight versus
Year&Age
Analysis of
Variance for Weight
Source DF
SS MS F P
Year&Age 3
582.080 194.027 197.91
0.000
Error 291
285.292 0.980
Total 294
867.372
Individual
95% CIs For Mean
Based on Pooled StDev
Level N
Mean StDev -------+---------+---------+---------
Y1A3 75
0.6001 0.6071 (-*-)
Y1A4 68
2.6134 1.4254 (-*-)
Y2A3 72
1.0436 0.5705 (-*-)
Y2A4 80
4.0849 1.1182 (-*-)
-------+---------+---------+---------
Pooled StDev
= 0.9901 1.2
2.4 3.6
Grafico 2
Tukey's pairwise comparisons
Family error rate = 0.0500
Individual
error rate = 0.0108
Critical
value = 3.63
Intervals
for (column level mean) - (row level mean)
Y1A3 Y1A4 Y2A3
Y1A4
-2.4388
-1.5877
Y2A3 -0.8628 1.1400
-0.0242 1.9995
Y2A4 -3.8932
-1.8907 -3.4541
-3.0763 -1.0523 -2.6284
Fisher's
pairwise comparisons
Family error rate = 0.200
Individual
error rate = 0.0500
Critical
value = 1.968
Intervals
for (column level mean) - (row level mean)
Y1A3 Y1A4 Y2A3
Y1A4
-2.3395
-1.6870
Y2A3 -0.7650 1.2403
-0.1220 1.8993
Y2A4 -3.7979
-1.7929 -3.3578
-3.1715 -1.1501 -2.7247
Com’era lecito attendersi, il valore del p-value pari a 0 indica che i dati a disposizione supportano il rifiuto dell’ipotesi nulla e quindi č possibile affermare che i 4 sottocampioni rappresentano una stratificazione sensata del nostro campione che altrimenti sarebbe stato troppo disomogeneo al proprio interno per condurre una corretta analisi, fatto evidente anche dall’osservazione del grafico 2.
La tabella dei confronti multipli tra le coppie di medie ci indica che tutte le 6 differenze tra i sottocampioni sono significativamente diverse tra loro dal momento che tutti gli intervalli di confidenza escludono il valore 0. Questo risultato dimostra che non solo possiamo affermare che i valori medie del peso sono diversi tra loro (analisi della varianza) ma che ciascun gruppo ha una media significativamente diversa da ciascun altro gruppo.
A questo punto focalizziamo l’attenzione sul fattore di coltura Treatment il cui effetto, potendo esso assumere quattro diverse modalitŕ, deve essere studiato con il metodo dell’analisi della varianza.
ü Stat > ANOVA > One-way
ü Response=Weight
ü Factor= Treatment
ü Clic su Comparison, attivare l’opzione Tukey’s, Fisher’s e Dunnett’s (Control Group level=1); OK
ü Clic su Graph, attivare l’opzione Boxplots of data; OK
ü
OK
One-way ANOVA: Weight versus
Treatment
Analysis of
Variance for Weight
Source DF
SS MS F P
Treatmen 3
65.79 21.93 7.96
0.000
Error 291
801.59 2.75
Total 294
867.37
Individual 95% CIs For Mean
Based on
Pooled StDev
Level N
Mean StDev ---------+---------+---------+-------
1 74 1.788 1.593 (------*-----)
2 75 2.171 1.690 (-----*-----)
3 74 1.653 1.347 (------*-----)
4 72 2.878 1.959 (-----*-----)
---------+---------+---------+-------
Pooled StDev
= 1.660 1.80 2.40 3.00
Dunnett's
comparisons with a control
Grafico 3
Family error rate = 0.0500
Individual
error rate = 0.0195
Critical
value = 2.35
Control =
level (1) of Treatmen
Intervals
for treatment mean minus control mean
Level Lower Center Upper
--+---------+---------+---------+-----
2 -0.257 0.382 1.021 (--------*---------)
3 -0.776 -0.135 0.506 (--------*--------)
4 0.444 1.089 1.735 (---------*--------)
--+---------+---------+---------+-----
-0.70 0.00 0.70 1.40
Tukey's pairwise comparisons
Family error rate = 0.0500
Individual
error rate = 0.0108
Critical
value = 3.63
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-1.080
0.316
3
-0.565 -0.181
0.835 1.215
4
-1.795 -1.410 -1.930
-0.384 -0.004 -0.519
Fisher's
pairwise comparisons
Family error rate = 0.200
Individual
error rate = 0.0500
Critical
value = 1.968
Intervals
for (column level mean) - (row level mean)
1
2 3
2
-0.917
0.153
3
-0.402 -0.018
0.672 1.052
4
-1.630 -1.246 -1.765
-0.549 -0.168 -0.684
Anche in questa seconda analisi osserviamo un p-value uguale a 0 e quindi il fattore Treatment č determinante per un diverso valore medio di Weigth all’interno del nostro campione. Risulta perň estremamente interessante, come risulta dall’osservazione della tabella dei confronti multipli, che solamente il Trattamento 4 č significativamente diverso (anzi piů efficace visto che intervalli di confidenza sono tutti minori di zero) rispetto tutti gli altri trattamenti mentre gli altri tre sono tra loro indistinguibili. Considerazione avvalorata dal confronto multiplo con il metodo di Dunnett: rispetto al livello 1, cioč al trattamento di controllo, solo il trattamento 4 si distingue, anzi č superiore, mentre 2 e 3 non sono distinguibili dal controllo stesso.
Per combinare in qualche modo l’effetto di Treatment con gli strati Year&Age ripetiamo l’ultimo test per ciascuno dei 4 sottocampioni Year&Age: attivare uno ad uno i worksheet corrispondenti e ripetere la precedente procedura.
Results for: Poplar.MTW(Year&Age
= Y1A3)
One-way ANOVA: Weight versus
Treatment
Analysis of
Variance for Weight
Source DF
SS MS F P
Treatmen 3
7.282 2.427 8.62
0.000
Error 71
19.990 0.282
Total 74
27.272
Individual 95% CIs For Mean
Based on
Pooled StDev
Level N
Mean StDev ---------+---------+---------+-------
1 20 0.3540 0.3094 (-----*-----)
2 20 0.6265 0.5896 (-----*-----)
3 17 0.3176 0.2705 (-----*-----)
4 18 1.1111 0.7820 (-----*-----)
---------+---------+---------+-------
Pooled StDev
= 0.5306 0.40 0.80 1.20
Dunnett's
comparisons with a control
Grafico 4
Family error rate = 0.0500
Individual
error rate = 0.0188
Critical
value = 2.40
Control =
level (1) of Treatmen
Intervals
for treatment mean minus control mean
Level Lower Center Upper
----------+---------+---------+-------
2 -0.1310 0.2725 0.6760 (-------*--------)
3 -0.4573 -0.0364 0.3846 (-------*--------)
4 0.3426 0.7571 1.1717 (-------*-------)
----------+---------+---------+-------
0.00 0.50 1.00
Tukey's
pairwise comparisons
Family error rate = 0.0500
Individual
error rate = 0.0105
Critical
value = 3.72
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-0.7139
0.1689
3
-0.4241 -0.1516
0.4968 0.7693
4
-1.2106 -0.9381 -1.2655
-0.3036 -0.0311 -0.3214
Fisher's
pairwise comparisons
Family error rate = 0.200
Individual
error rate = 0.0500
Critical
value = 1.994
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-0.6071
0.0621
3
-0.3127 -0.0402
0.3854 0.6579
4
-1.1009 -0.8284 -1.1513
-0.4134 -0.1409 -0.4356
Results for: Poplar.MTW(Year&Age
= Y2A3)
One-way ANOVA: Weight versus
Treatment
Analysis of
Variance for Weight
Source DF
SS MS F P
Treatmen 3
3.909 1.303 4.61
0.005
Error 68
19.202 0.282
Total 71
23.111
Individual 95% CIs For Mean
Based on
Pooled StDev
Level N
Mean StDev ---+---------+---------+---------+---
1 17 1.0629 0.4865 (-------*--------)
2 17 0.9371 0.4482 (-------*--------)
3 19 0.7726 0.4439 (-------*-------)
4 19 1.3926 0.6934 (-------*--------)
---+---------+---------+---------+---
Pooled StDev
= 0.5314 0.60
0.90 1.20 1.50
Dunnett's
comparisons with a control
Grafico 5
Family error rate
= 0.0500
Individual
error rate = 0.0192
Critical
value = 2.40
Control =
level (1) of Treatmen
Intervals
for treatment mean minus control mean
Level Lower Center Upper
--------+---------+---------+---------
2 -0.5631 -0.1259 0.3114 (----------*----------)
3 -0.7159 -0.2903 0.1353
(----------*---------)
4 -0.0959 0.3297 0.7553 (---------*----------)
--------+---------+---------+---------
-0.40 0.00 0.40
Tukey's
pairwise comparisons
Family error rate = 0.0500
Individual
error rate = 0.0105
Critical
value = 3.72
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-0.3536
0.6053
3
-0.1763 -0.3022
0.7570 0.6311
4
-0.7963 -0.9222 -1.0735
0.1370 0.0111 -0.1665
Fisher's
pairwise comparisons
Family error rate = 0.200
Individual
error rate = 0.0500
Critical
value = 1.995
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-0.2377
0.4895
3
-0.0636 -0.1895
0.6442 0.5184
4
-0.6836 -0.8095 -0.9640
0.0242 -0.1016 -0.2760
Results for: Poplar.MTW(Year&Age
= Y1A4)
One-way ANOVA: Weight versus
Treatment
Analysis of
Variance for Weight
Source DF
SS MS F P
Treatmen 3
51.20 17.07 12.86
0.000
Error 64 84.93 1.33
Total 67
136.13
Individual
95% CIs For Mean
Based on
Pooled StDev
Level N
Mean StDev ---------+---------+---------+-------
1 17 1.679 0.906 (-----*----)
2 18 2.872 1.469 (-----*----)
3 18 2.064 0.995 (-----*----)
4 15 4.021 1.143 (-----*-----)
---------+---------+---------+-------
Pooled StDev
= 1.152 2.0
3.0 4.0
Dunnett's
comparisons with a control
Grafico 6
Family error rate
= 0.0500
Individual
error rate = 0.0190
Critical
value = 2.41
Control =
level (1) of Treatmen
Intervals
for treatment mean minus control mean
Level Lower Center Upper
-----+---------+---------+---------+--
2 0.255 1.192 2.130 (-------*-------)
3 -0.553 0.384 1.322
(-------*-------)
4 1.360
2.342 3.324 (--------*-------)
-----+---------+---------+---------+--
0.0 1.2 2.4 3.6
Tukey's
pairwise comparisons
Family error rate = 0.0500
Individual
error rate = 0.0105
Critical
value = 3.73
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-2.220
-0.165
3
-1.412 -0.205
0.643 1.821
4
-3.418 -2.212 -3.020
-1.266 -0.087 -0.895
Fisher's
pairwise comparisons
Family error rate = 0.200
Individual
error rate = 0.0500
Critical
value = 1.998
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-1.971
-0.414
3
-1.163 0.041
0.394 1.575
4
-3.157 -1.954 -2.762
-1.527
-0.345 -1.153
Results for: Poplar.MTW(Year&Age
= Y2A4)
One-way ANOVA: Weight versus
Treatment
Analysis of
Variance for Weight
Source DF
SS MS F P
Treatmen 3
31.780 10.593 12.02
0.000
Error 76
67.002 0.882
Total 79
98.782
Individual
95% CIs For Mean
Based on
Pooled StDev
Level N
Mean StDev -----+---------+---------+---------+-
1 20 3.9315 1.1338 (----*----)
2 20 4.1320 0.5395 (-----*----)
3 20 3.2555 0.7797 (-----*----)
4 20 5.0205 1.1585 (----*----)
-----+---------+---------+---------+-
Pooled StDev
= 0.9389 3.20
4.00 4.80 5.60
Dunnett's
comparisons with a control
Grafico 7
Family error rate
= 0.0500
Individual
error rate = 0.0190
Critical
value = 2.40
Control =
level (1) of Treatmen
Intervals
for treatment mean minus control mean
Level Lower Center Upper
----+---------+---------+---------+---
2 -0.5112 0.2005 0.9122 (------*------)
3 -1.3877 -0.6760 0.0357
(------*------)
4 0.3773 1.0890 1.8007 (------*------)
----+---------+---------+---------+---
-1.0 0.0 1.0 2.0
Tukey's
pairwise comparisons
Family error rate = 0.0500
Individual
error rate = 0.0103
Critical
value = 3.72
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-0.9815
0.5805
3 -0.1050 0.0955
1.4570 1.6575
4
-1.8700 -1.6695 -2.5460
-0.3080 -0.1075 -0.9840
Fisher's
pairwise comparisons
Family error rate = 0.200
Individual
error rate = 0.0500
Critical
value = 1.992
Intervals
for (column level mean) - (row level mean)
1 2 3
2
-0.7920
0.3910
3
0.0845 0.2850
1.2675 1.4680
4
-1.6805 -1.4800 -2.3565
-0.4975 -0.2970 -1.1735
Dal confronto incrociato dei risultati dell’analisi della varianza del fattore Treatment, per tutto il campione e per ciascuno dei 4 strati, possiamo concludere che:
· il fattore Treatment induce un effetto differenziale per la variabile Weight
o tale effetto č dovuto alla differenza tra il livello del fattore Treatment corrispondente a Treatment =4, cioč “fertilizzante e irrigazione”, e tutti i restanti livelli (1=”nessun trattamento”, 2=”fertilizzante”, 3=”irrigazione”)
o i restanti tre livelli sono tra loro indistinguibili
· affinando l’analisi a ciascuno dei 4 strati definiti dalla variabile Year&Age possiamo aggiungere che
o lo strato Year&Age =Y1A3 si comporta come l’intero campione
o lo strato Year&Age =Y2A3 mostra un’unica differenza significativa tra il livello 3 e 4
o lo strato Year&Age =Y1A4 si comporta come l’intero campione con in aggiunta un differenza significativa tra il livello 1 e 2
o lo strato Year&Age =Y2A4 si comporta come l’intero campione con in aggiunta un differenza significativa tra il livello 2 e 3