Esempio 4
Segue dall’Esempio 1,2 e 3
Analisi della varianza a più vie
con GLM
Per poter cogliere tutti assieme in un unico modello i diversi fattori che determinano la variabile risposta Weigth è necessario utilizzare il metodo dell’analisi della varianza GLM (General Linear Model). Esso ci consente anche di stabilire se esiste una interazione tra i diversi fattori nella determinazione del peso della pianta Poplar.
Nel corso dell’Esempio 2 con un Test t a due campioni abbiamo rilevato come la variabile Site non sia influente nella determinazione di Weigth (l’analisi della varianza ad una via per un fattore a due livelli coincide con un test t a due campioni, non ha senso quindi ripetere l’analisi). Questo risultato non esclude comunque che dall’interazione dei due fattori Site e Treatment possano nascere delle sinergie tali che la variabile Weigth ne risulti influenzata.
Per studiare questo problema, assieme a quello dell’eventuale interazione tra i due fattori Site e Treatment e la variabile di stratificazione Years&Age costruiamo il seguente grafico:
ü Stat > ANOVA > Interactions Plot
ü Response=Weight
ü Factors= Site Treatment 'Year&Age'
ü selezionare Display full interaction plot matrix
ü
OK
Grafico 1
Dall’analisi del grafico 1 sembra che Site e Treatment generino una interazione come indica il fatto che le linee delle medie dei livelli si intersecano tra loro alcune (2 per Site vs Treatment e 1 per Treatment vs Site). Per non complicare eccessivamente il modello non consideriamo le altre eventuali interazioni.
A partire dal worlsheet principale Poplar.mtw, seguire la seguente procedura:
ü Stat > ANOVA > General Linear Model
ü Response=Weight
ü Model=’Years&Age’ Site Treatment Site*Treatment
ü Clic su Comparisons, Terms: Site Treatment Site*Treatment
ü Clic su Graph, attivare l’opzione Histogram of residuals e Normal plot of residuals; OK
ü
OK
General Linear Model: Weight versus
Year&Age; Site; Treatment
Factor Type Levels Values
Year&Age fixed
4 Y1A3 Y1A4 Y2A3 Y2A4
Site fixed 2 1 2
Treatmen fixed
4 1 2 3 4
Analysis of
Variance for Weight, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
Year&Age 3
582.080 580.911 193.637
264.81 0.000
Site 1 0.783 0.718 0.718
0.98 0.323
Grafico 2
Treatmen
3 68.637 68.361 22.787 31.16 0.000
Site*Treatmen 3
8.204 8.204 2.735
3.74 0.012
Error 284 207.669 207.669 0.731
Total 294 867.372
Unusual
Observations for Weight
Obs Weight Fit SE Fit Residual
St Resid
154 0.25000
2.18797 0.16451 -1.93797
-2.31R
160 4.92000
2.69185 0.16621 2.22815 2.66R
161 4.38000
2.69185 0.16621 1.68815 2.01R
163 4.49000
2.69185 0.16621 1.79815 2.14R
169 0.35000
2.32498 0.16506 -1.97498
-2.35R
174 4.05000
2.32498 0.16506 1.72502 2.06R
178 5.21000
3.13846 0.17154 2.07154 2.47R
180 5.12000
3.13846 0.17154 1.98154 2.37R
181 6.19000
3.13846 0.17154 3.05154 3.64R
189 0.64000
2.44663 0.17102 -1.80663
-2.16R
190 0.16000
2.44663 0.17102 -2.28663
-2.73R
192 5.69000
2.67891 0.16628 3.01109 3.59R
199 0.66000
2.67891 0.16628 -2.01891
-2.41R
219 5.82000
3.89631 0.16521 1.92369 2.29R
Grafico 3
258 6.93000 5.11532
0.16388 1.81468 2.16R
R denotes an
observation with a large standardized residual.
Dall’analisi dei valori dei p-value concludiamo che:
· come dal test a due campioni la variabile Site non determina una differenza per la variabile risposta Weight
· come dall’analisi della varianza ad una via il fattore Treatment è determinante per la variabile risposta Weight
· la nuova variabile Site*Treatment, che misura l’interazione tra le due variabili, è anch’essa significativa per la variabile risposta Weight
Dall’analisi dei grafici sui residui concludiamo che:
· i residui si comportano sostanzialmente secondo la distribuzione normale indicando che il modello è correttamente specificato
Nella specificazione di quali confronti multipli realizzare, all’interno della finestra di dialogo GLM sono stati presi in considerazione anche i confronti marginali (cioè al netto degli altri fattori) tra i livelli delle variabili Site e Treatment. Si potrebbe pensare che tale confronto è già stato studiato nel corso dell’esempio 3 (ANOVA ad una via); in realtà l’analisi ANOVA precedente soffriva di una grave limitazione dal momento che l’esclusione di alcune variabili in gioco (soprattutto Years&Age) non permetteva di cogliere la reale relazione tra fattori di trattamento ed i gruppi di piante che nell’esperimento in questione risultavano contemporaneamente influenzate da tutti i fattori.
Passiamo quindi all’analisi di ciascun gruppo di confronti multipli.
L’output del primo confronto è il seguente:
Tukey 95.0%
Simultaneous Confidence Intervals
Response
Variable Weight
All Pairwise
Comparisons among Levels of Site
Site = 1
subtracted from:
Site Lower
Center Upper -----+---------+---------+---------+-
2 -0.2950
-0.09877 0.09742 (----------------*---------------)
-----+---------+---------+---------+-
-0.24 -0.12 0.00 0.12
Tukey
Simultaneous Tests
Response
Variable Weight
All Pairwise
Comparisons among Levels of Site
Site = 1
subtracted from:
Level Difference SE of
Adjusted
Site of Means Difference T-Value P-Value
2 -0.09877 0.09967 -0.9909 0.3217
Viene confermato quanto già osservato cioè che Sito 1 e Sito 2 sono equivalenti dal punto di vista della variabile risposta Weight.
L’output del secondo confronto è il seguente:
Tukey 95.0%
Simultaneous Confidence Intervals
Response Variable
Weight
All Pairwise
Comparisons among Levels of Treatmen
Treatmen = 1
subtracted from:
Treatmen Lower
Center Upper ---+---------+---------+---------+---
2 0.0080 0.3681 0.7281 (----*----)
3 -0.5426 -0.1812 0.1801 (----*-----)
4 0.7210 1.0848 1.4485 (----*-----)
---+---------+---------+---------+---
-0.70 0.00 0.70 1.40
Treatmen = 2
subtracted from:
Treatmen Lower
Center Upper ---+---------+---------+---------+---
3 -0.9093 -0.5493 -0.1893 (----*----)
4 0.3541 0.7167 1.0792 (----*----)
---+---------+---------+---------+---
-0.70 0.00 0.70 1.40
Treatmen = 3
subtracted from:
Treatmen Lower
Center Upper ---+---------+---------+---------+---
4 0.9025 1.266 1.629 (----*----)
---+---------+---------+---------+---
-0.70 0.00 0.70 1.40
Tukey
Simultaneous Tests
Response
Variable Weight
All Pairwise
Comparisons among Levels of Treatmen
Treatmen = 1
subtracted from:
Level Difference SE of
Adjusted
Treatmen of Means Difference T-Value P-Value
2 0.3681 0.1403 2.624 0.0432
3 -0.1812 0.1408 -1.287 0.5710
4 1.0848 0.1417 7.654 -0.0000
Treatmen = 2
subtracted from:
Level Difference SE of
Adjusted
Treatmen of Means Difference T-Value P-Value
3 -0.5493 0.1402 -3.917 0.0005
4 0.7167 0.1413 5.074 0.0000
Treatmen = 3
subtracted from:
Level Difference SE of
Adjusted
Treatmen of Means Difference T-Value P-Value
4 1.266 0.1416 8.939 -0.000
I risultati di tutti i confronti a coppie sono riassunti nella seguente tabella (riga-colonna):
|
Tratt=1 |
Tratt=2 |
Tratt=3 |
Tratt=2 |
+ |
|
|
Tratt=3 |
= |
- |
|
Tratt=4 |
+ |
+ |
+ |
Tukey 95.0%
Simultaneous Confidence Intervals
Response
Variable Weight
All Pairwise
Comparisons among Levels of Site*Treatmen
Site = 1
Treatmen = 1
subtracted from:
Site*Treatmen Lower
Center Upper
1 2 -0.384
0.2323 0.8483
1 3 -1.111
-0.4995 0.1123
1 4 0.603
1.2190 1.8348
2 1 -0.863
-0.2587 0.3454
2 2 -0.359
0.2452 0.8494
2 3 -0.734
-0.1216 0.4903
2 4 0.076
0.6918 1.3079
Site*Treatmen --------+---------+---------+--------
1 2 (----*----)
1 3 (----*----)
1 4 (----*----)
2 1 (----*----)
2 2 (----*----)
2 3 (----*----)
2 4 (----*----)
--------+---------+---------+--------
-1.2 0.0 1.2
Site = 1
Treatmen = 2
subtracted from:
Site*Treatmen Lower
Center Upper
1 3 -1.340
-0.7318 -0.1237
1 4 0.375
0.9867 1.5986
2 1 -1.091
-0.4909 0.1090
2 2 -0.587
0.0129 0.6133
2 3 -0.961
-0.3539 0.2536
2 4 -0.153
0.4595 1.0721
Site*Treatmen --------+---------+---------+--------
1 3 (----*----)
1 4 (----*----)
2 1 (----*----)
2 2 (----*----)
2 3 (----*----)
2 4 (----*----)
--------+---------+---------+--------
-1.2 0.0 1.2
Site = 1
Treatmen = 3
subtracted from:
Site*Treatmen Lower
Center Upper
1 4
1.1112 1.7185 2.3258
2 1
-0.3548 0.2408 0.8364
2 2 0.1492
0.7447 1.3402
2 3
-0.2256 0.3778 0.9813
2 4 0.5840
1.1913 1.7986
Site*Treatmen --------+---------+---------+--------
1 4 (----*----)
2 1 (----*----)
2 2 (----*----)
2 3 (----*----)
2 4 (----*----)
--------+---------+---------+--------
-1.2 0.0 1.2
Site = 1
Treatmen = 4
subtracted from:
Site*Treatmen Lower
Center Upper
2 1 -2.077
-1.478 -0.8780
2 2 -1.573
-0.974 -0.3741
2 3 -1.948
-1.341 -0.7331
2 4 -1.139
-0.527 0.0843
Site*Treatmen --------+---------+---------+--------
2 1
(----*----)
2 2 (----*----)
2 3 (----*----)
2 4
(----*----)
--------+---------+---------+--------
-1.2 0.0 1.2
Site = 2
Treatmen = 1
subtracted from:
Site*Treatmen Lower
Center Upper
2 2
-0.0837 0.5039 1.0914
2 3
-0.4588 0.1370 0.7328
2 4 0.3506
0.9505 1.5504
Site*Treatmen --------+---------+---------+--------
2 2 (----*----)
2 3 (----*----)
2 4 (----*----)
--------+---------+---------+--------
-1.2 0.0 1.2
Site = 2
Treatmen = 2
subtracted from:
Site*Treatmen Lower
Center Upper
2 3
-0.9629 -0.3669 0.2292
2 4
-0.1531 0.4466 1.0463
Site*Treatmen --------+---------+---------+--------
2 3 (----*----)
2 4 (----*----)
--------+---------+---------+--------
-1.2 0.0 1.2
Site = 2
Treatmen = 3
subtracted from:
Site*Treatmen Lower
Center Upper
2 4 0.2056
0.8135 1.421
Site*Treatmen --------+---------+---------+--------
2 4 (----*----)
--------+---------+---------+--------
-1.2 0.0 1.2
Tukey
Simultaneous Tests
Response
Variable Weight
All Pairwise
Comparisons among Levels of Site*Treatmen
Site = 1
Treatmen = 1
subtracted from:
Level Difference SE of Adjusted
Site*Treatmen of Means Difference T-Value P-Value
1 2 0.2323
0.2031 1.144 0.9471
1 3 -0.4995
0.2017 -2.476
0.2055
1 4 1.2190
0.2030 6.005 0.0000
2 1 -0.2587
0.1991 -1.299 0.8996
2 2 0.2452
0.1992 1.231 0.9228
2 3 -0.1216
0.2017 -0.603 0.9989
2 4 0.6918
0.2031 3.407 0.0152
Site = 1
Treatmen = 2
subtracted from:
Level Difference SE of Adjusted
Site*Treatmen of Means Difference T-Value P-Value
1 3
-0.7318 0.2004 -3.651 0.0064
1 4 0.9867
0.2017 4.892 0.0000
2 1 -0.4909
0.1978 -2.482 0.2028
2 2 0.0129
0.1979 0.065 1.0000
2 3 -0.3539
0.2003 -1.767 0.6425
2 4 0.4595
0.2019 2.276 0.3069
Site = 1
Treatmen = 3
subtracted from:
Level Difference SE of Adjusted
Site*Treatmen of Means Difference T-Value P-Value
1 4 1.7185
0.2002 8.584 0.0000
2 1 0.2408
0.1963 1.227 0.9243
2 2 0.7447
0.1963 3.794 0.0037
2 3 0.3778
0.1989 1.899 0.5513
2 4 1.1913
0.2002 5.950 0.0000
Site = 1
Treatmen = 4
subtracted from:
Level Difference SE of Adjusted
Site*Treatmen of Means Difference T-Value P-Value
2 1 -1.478 0.1977 -7.475 0.0000
2 2 -0.974
0.1977 -4.926 0.0000
2 3 -1.341
0.2003 -6.694 0.0000
2 4 -0.527
0.2016 -2.615 0.1503
Site = 2
Treatmen = 1
subtracted from:
Level Difference SE of Adjusted
Site*Treatmen of Means Difference T-Value P-Value
2 2 0.5039
0.1937 2.6016 0.1552
2 3 0.1370
0.1964 0.6976 0.9971
2 4 0.9505
0.1978 4.8061 0.0000
Site = 2
Treatmen = 2
subtracted from:
Level Difference SE of Adjusted
Site*Treatmen of Means Difference T-Value P-Value
2 3
-0.3669 0.1965 -1.867 0.5737
2 4 0.4466
0.1977 2.259 0.3165
Site = 2
Treatmen = 3
subtracted from:
Level Difference SE of Adjusted
Site*Treatmen of Means Difference T-Value P-Value
2 4 0.8135
0.2004 4.059 0.0013
I risultati di tutti i confronti a coppie sono riassunti nella seguente tabella (+ e – si riferiscono a: livello riga – livello colonna):
|
|
Sito=1 |
Sito=2 |
|||||
|
|
Tratt=1 |
Tratt=2 |
Tratt=3 |
Tratt=4 |
Tratt=1 |
Tratt=2 |
Tratt=3 |
Sito=1 |
Tratt=2 |
= |
|
|
|
|
|
|
Tratt=3 |
= |
- |
|
|
|
|
|
|
Tratt=4 |
+ |
+ |
+ |
|
|
|
|
|
Sito=2 |
Tratt=1 |
= |
= |
= |
- |
|
|
|
Tratt=2 |
= |
= |
+ |
- |
= |
|
|
|
Tratt=3 |
= |
= |
= |
- |
= |
= |
|
|
Tratt=4 |
+ |
= |
+ |
= |
+ |
= |
+ |
In conclusione, focalizzando l’attenzione sul contributo individuale delle variabili Site e Treatment, possiamo affermare che
· la variabile Site non è determinante per la variabile risposta Weight
· la variabile Treatment è determinante per la variabile risposta Weight ed in particolare
o il Trattamento 4 (fertilizzante + irrigazione) è superiore a tutti gli altri trattamenti
o il Trattamento 2 (fertilizzante) è superiore agli altri 2 trattamenti (1=controllo e 3=irrigazione)
o il Trattamento 1 (irrigazione) e 3 (controllo) sono equivalenti
Invece, focalizzando l’attenzione sulle interazioni tra Site e Treatment ed evidenziando le differenze rispetto ai confronti marginali sopra esposti, è possibile affermare che
· nel Sito 2 il Trattamento 4 è indistinguibile del Trattamento 2 (fertilizzante)
· separando i dati per Sito non risulta che in nessuno dei due il Trattamento 2 sia superiore al Trattamento 1 ed inoltre solo nel Sito 1 esso si dimostra superiore al Trattamento 3
· il Trattamento 2 è superiore al Trattamento 3 solo dal confronto tra Sito 1 rispetto al Sito 2
· i medesimi trattamenti confrontati a coppie tra i due Siti sono indistinguibili tra loro (celle in celeste sulla diagonale in basso a sinistra)