Esempio 3

Segue dall’Esempio 1 e 2

Analisi della varianza

Come naturale estensione delle tecniche di inferenza statistica del test a due campioni l’analisi della varianza ci permette di estendere e sviluppare l’indagine statistica alla ricerca di tutte le interrelazioni esistenti tra le variabili in gioco nella determinazione della crescita e dello sviluppo della pianta Poplar.

Analisi della varianza ad una via

Prima di procedere con l’analisi della varianza ad una via vera e propria cerchiamo di capire la rilevanza delle diverse variabili di stratificazione nella determinazione dei valori medi di Weigth.

A questo scopo utilizziamo il grafico Main Effect Plot:

ü      Stat > ANOVA > Main Effect Plot

ü      Response=Weight

ü      Factors= Site Treatment 'Year&Age'

ü      OK

 


Ribadiamo che Site e Treatment sono dei veri e propri fattori mentre Year&Age č una variabile di stratificazione che sottindente, oltre all’etŕ della pianta, dei fattori forse non debitamente misurati.

Come abbiamo giŕ appreso dall’esempio 1 e 2 la variabile Site si mostra ininfluente ai fini della comprensione della variabilitŕ di Weight mentre Treatment e Year&Age presentano delle medie notevolmente diverse dalla media globale per almeno uno dei propri livelli.

Dopo questa premessa cominciamo con l’analisi della varianza ad una via vera e propria.

Per prima cosa confermiamo la bontŕ della stratificazione del nostro campione in base alle 4 combinazioni delle variabili Year e Age: nel caso in cui sulla base dell’analisi della varianza i valori medi della variabile Weigth si dimostreranno significativamente diversi tra loro, allora i 4 sottocampioni saranno strati molto significativi al fine di meglio capire le cause della variabilitŕ della variabile risposta.

A partire dal worlsheet principale Poplar.mtw, la procedura č la seguente:

ü      Stat > ANOVA > One-way

ü      Response=Weight

ü      Factor=Year&Age

ü      Clic su Comparison, attivare l’opzione Tukey’s e Fisher; OK

ü      Clic su Graph, attivare l’opzione Boxplots of data; OK

ü      OK

 

One-way ANOVA: Weight versus Year&Age

 

Analysis of Variance for Weight 

Source     DF        SS        MS        F        P

Year&Age    3   582.080   194.027   197.91    0.000

Error     291   285.292     0.980

Total     294   867.372

                                   Individual 95% CIs For Mean

                                   Based on Pooled StDev

Level       N      Mean     StDev  -------+---------+---------+---------

Y1A3       75    0.6001    0.6071  (-*-)

Y1A4       68    2.6134    1.4254                   (-*-)

Y2A3       72    1.0436    0.5705      (-*-)

Y2A4       80    4.0849    1.1182                               (-*-)

                                   -------+---------+---------+---------

Pooled StDev =   0.9901                 1.2       2.4       3.6

 

Grafico 2

 
Tukey's pairwise comparisons

 

    Family error rate = 0.0500

Individual error rate = 0.0108

 

Critical value = 3.63

 

Intervals for (column level mean) - (row level mean)

 

              Y1A3        Y1A4        Y2A3

 

    Y1A4     -2.4388

             -1.5877

 

    Y2A3     -0.8628      1.1400

             -0.0242      1.9995

 

    Y2A4     -3.8932     -1.8907     -3.4541

             -3.0763     -1.0523     -2.6284

 

Fisher's pairwise comparisons

 

    Family error rate = 0.200

Individual error rate = 0.0500

 

Critical value = 1.968

 

Intervals for (column level mean) - (row level mean)

 

                Y1A3        Y1A4        Y2A3

 

    Y1A4     -2.3395

             -1.6870

 

    Y2A3     -0.7650      1.2403

             -0.1220      1.8993

 

    Y2A4     -3.7979     -1.7929     -3.3578

             -3.1715     -1.1501     -2.7247

 

Com’era lecito attendersi, il valore del p-value pari a 0 indica che i dati a disposizione supportano il rifiuto dell’ipotesi nulla e quindi č possibile affermare che i 4 sottocampioni rappresentano una stratificazione sensata del nostro campione che altrimenti sarebbe stato troppo disomogeneo al proprio interno per condurre una corretta analisi, fatto evidente anche dall’osservazione del grafico 2.

La tabella dei confronti multipli tra le coppie di medie ci indica che tutte le 6 differenze tra i sottocampioni sono significativamente diverse tra loro dal momento che tutti gli intervalli di confidenza escludono il valore 0. Questo risultato dimostra che non solo possiamo affermare che i valori medie del peso sono diversi tra loro (analisi della varianza) ma che ciascun gruppo ha una media significativamente diversa da ciascun altro gruppo.

A questo punto focalizziamo l’attenzione sul fattore di coltura Treatment il cui effetto, potendo esso assumere quattro diverse modalitŕ, deve essere studiato con il metodo dell’analisi della varianza.

ü      Stat > ANOVA > One-way

ü      Response=Weight

ü      Factor= Treatment

ü      Clic su Comparison, attivare l’opzione Tukey’s, Fisher’s e Dunnett’s (Control Group level=1); OK

ü      Clic su Graph, attivare l’opzione Boxplots of data; OK

ü      OK

 

One-way ANOVA: Weight versus Treatment

 


Analysis of Variance for Weight 

Source     DF        SS        MS        F        P

Treatmen    3     65.79     21.93     7.96    0.000

Error     291    801.59      2.75

Total     294    867.37

                                   Individual 95% CIs For Mean

                                   Based on Pooled StDev

Level       N      Mean     StDev  ---------+---------+---------+-------

1          74     1.788     1.593    (------*-----)

2          75     2.171     1.690           (-----*-----)

3          74     1.653     1.347  (------*-----)

4          72     2.878     1.959                       (-----*-----)

                                   ---------+---------+---------+-------

Pooled StDev =    1.660                   1.80      2.40      3.00

 

Dunnett's comparisons with a control

Grafico 3

 
 


    Family error rate = 0.0500

Individual error rate = 0.0195

 

Critical value = 2.35

 

Control = level (1) of Treatmen

 

Intervals for treatment mean minus control mean

 

Level        Lower    Center     Upper --+---------+---------+---------+-----

2           -0.257     0.382     1.021         (--------*---------)

3           -0.776    -0.135     0.506  (--------*--------)

4            0.444     1.089     1.735                   (---------*--------)

                                       --+---------+---------+---------+-----

                                      -0.70      0.00      0.70      1.40

 

 Tukey's pairwise comparisons

 

    Family error rate = 0.0500

Individual error rate = 0.0108

 

Critical value = 3.63

 

Intervals for (column level mean) - (row level mean)

 

                 1           2           3

 

       2      -1.080

               0.316

 

       3      -0.565      -0.181

               0.835       1.215

 

       4      -1.795      -1.410      -1.930

              -0.384      -0.004      -0.519

 

Fisher's pairwise comparisons

 

    Family error rate = 0.200

Individual error rate = 0.0500

 

Critical value = 1.968

 

Intervals for (column level mean) - (row level mean)

 

                   1           2           3

 

       2      -0.917

               0.153

 

       3      -0.402      -0.018

               0.672       1.052

 

       4      -1.630      -1.246      -1.765

              -0.549      -0.168      -0.684

 

Anche in questa seconda analisi osserviamo un p-value uguale a 0 e quindi il fattore Treatment č determinante per un diverso valore medio di Weigth all’interno del nostro campione. Risulta perň estremamente interessante, come risulta dall’osservazione della tabella dei confronti multipli, che solamente il Trattamento 4 č significativamente diverso (anzi piů efficace visto che intervalli di confidenza sono tutti minori di zero) rispetto tutti gli altri trattamenti mentre gli altri tre sono tra loro indistinguibili. Considerazione avvalorata dal confronto multiplo con il metodo di Dunnett: rispetto al livello 1, cioč al trattamento di controllo, solo il trattamento 4 si distingue, anzi č superiore, mentre 2 e 3 non sono distinguibili dal controllo stesso.

Per combinare in qualche modo l’effetto di Treatment con gli strati Year&Age ripetiamo l’ultimo test per ciascuno dei 4 sottocampioni Year&Age: attivare uno ad uno i worksheet corrispondenti e ripetere la precedente procedura.

 

Results for: Poplar.MTW(Year&Age = Y1A3)

 

One-way ANOVA: Weight versus Treatment

 


Analysis of Variance for Weight 

Source     DF        SS        MS        F        P

Treatmen    3     7.282     2.427     8.62    0.000

Error      71    19.990     0.282

Total      74    27.272

                                   Individual 95% CIs For Mean

                                   Based on Pooled StDev

Level       N      Mean     StDev  ---------+---------+---------+-------

1          20    0.3540    0.3094    (-----*-----)

2          20    0.6265    0.5896           (-----*-----)

3          17    0.3176    0.2705   (-----*-----)

4          18    1.1111    0.7820                       (-----*-----)

                                   ---------+---------+---------+-------

Pooled StDev =   0.5306                   0.40      0.80      1.20

 

Dunnett's comparisons with a control

Grafico 4

 
 


    Family error rate = 0.0500

Individual error rate = 0.0188

 

Critical value = 2.40

 

Control = level (1) of Treatmen

 

Intervals for treatment mean minus control mean

 

Level        Lower    Center     Upper ----------+---------+---------+-------

2          -0.1310    0.2725    0.6760        (-------*--------)

3          -0.4573   -0.0364    0.3846  (-------*--------)

4           0.3426    0.7571    1.1717                  (-------*-------)

                                       ----------+---------+---------+-------

                                               0.00      0.50      1.00

 

 

Tukey's pairwise comparisons

 

    Family error rate = 0.0500

Individual error rate = 0.0105

 

Critical value = 3.72

 

Intervals for (column level mean) - (row level mean)

 

                 1           2           3

 

       2     -0.7139

              0.1689

 

       3     -0.4241     -0.1516

              0.4968      0.7693

 

       4     -1.2106     -0.9381     -1.2655

             -0.3036     -0.0311     -0.3214

 

 

 

Fisher's pairwise comparisons

 

    Family error rate = 0.200

Individual error rate = 0.0500

 

Critical value = 1.994

 

Intervals for (column level mean) - (row level mean)

 

                   1           2           3

 

       2     -0.6071

              0.0621

 

       3     -0.3127     -0.0402

              0.3854      0.6579

 

       4     -1.1009     -0.8284     -1.1513

             -0.4134     -0.1409     -0.4356

 

 

Results for: Poplar.MTW(Year&Age = Y2A3)

 

One-way ANOVA: Weight versus Treatment

 

Analysis of Variance for Weight 

Source     DF        SS        MS        F        P

Treatmen    3     3.909     1.303     4.61    0.005

Error      68    19.202     0.282

Total      71    23.111

                                   Individual 95% CIs For Mean

                                   Based on Pooled StDev

Level       N      Mean     StDev  ---+---------+---------+---------+---

1          17    1.0629    0.4865            (-------*--------)

2          17    0.9371    0.4482        (-------*--------)

3          19    0.7726    0.4439   (-------*-------)

4          19    1.3926    0.6934                       (-------*--------)

                                   ---+---------+---------+---------+---

Pooled StDev =   0.5314             0.60      0.90      1.20      1.50

 

Dunnett's comparisons with a control

 

Grafico 5

 
    Family error rate = 0.0500

Individual error rate = 0.0192

 

Critical value = 2.40

 

Control = level (1) of Treatmen

 

Intervals for treatment mean minus control mean

 

Level        Lower    Center     Upper --------+---------+---------+---------

2          -0.5631   -0.1259    0.3114     (----------*----------)

3          -0.7159   -0.2903    0.1353 (----------*---------)

4          -0.0959    0.3297    0.7553                 (---------*----------)

                                       --------+---------+---------+---------

                                            -0.40      0.00      0.40

 

 

Tukey's pairwise comparisons

 

    Family error rate = 0.0500

Individual error rate = 0.0105

 

Critical value = 3.72

 

Intervals for (column level mean) - (row level mean)

 

                 1           2           3

 

       2     -0.3536

              0.6053

 

       3     -0.1763     -0.3022

              0.7570      0.6311

 

       4     -0.7963     -0.9222     -1.0735

              0.1370      0.0111     -0.1665

 

 

 

Fisher's pairwise comparisons

 

    Family error rate = 0.200

Individual error rate = 0.0500

 

Critical value = 1.995

 

Intervals for (column level mean) - (row level mean)

 

                   1           2           3

 

       2     -0.2377

              0.4895

 

       3     -0.0636     -0.1895

              0.6442      0.5184

 

       4     -0.6836     -0.8095     -0.9640

              0.0242     -0.1016     -0.2760

 

Results for: Poplar.MTW(Year&Age = Y1A4)

 

One-way ANOVA: Weight versus Treatment

 

Analysis of Variance for Weight 

Source     DF        SS        MS        F        P

Treatmen    3     51.20     17.07    12.86    0.000

Error      64     84.93      1.33

Total      67    136.13

                                   Individual 95% CIs For Mean

                                   Based on Pooled StDev

Level       N      Mean     StDev  ---------+---------+---------+-------

1          17     1.679     0.906  (-----*----)

2          18     2.872     1.469              (-----*----)

3          18     2.064     0.995      (-----*----)

4          15     4.021     1.143                         (-----*-----)

                                   ---------+---------+---------+-------

Pooled StDev =    1.152                   2.0       3.0       4.0

 

Dunnett's comparisons with a control

 

Grafico 6

 
    Family error rate = 0.0500

Individual error rate = 0.0190

 

Critical value = 2.41

 

Control = level (1) of Treatmen

 

Intervals for treatment mean minus control mean

 

Level        Lower    Center     Upper -----+---------+---------+---------+--

2            0.255     1.192     2.130        (-------*-------)

3           -0.553     0.384     1.322 (-------*-------)

4            1.360     2.342     3.324                 (--------*-------)

                                       -----+---------+---------+---------+--

                                          0.0       1.2       2.4       3.6

 

 

Tukey's pairwise comparisons

 

    Family error rate = 0.0500

Individual error rate = 0.0105

 

Critical value = 3.73

 

Intervals for (column level mean) - (row level mean)

 

                 1           2           3

 

       2      -2.220

              -0.165

 

       3      -1.412      -0.205

               0.643       1.821

 

       4      -3.418      -2.212      -3.020

              -1.266      -0.087      -0.895

 

 

 

Fisher's pairwise comparisons

 

    Family error rate = 0.200

Individual error rate = 0.0500

 

Critical value = 1.998

 

Intervals for (column level mean) - (row level mean)

 

                   1           2           3

 

       2      -1.971

              -0.414

 

       3      -1.163       0.041

               0.394       1.575

 

       4      -3.157      -1.954      -2.762

              -1.527      -0.345      -1.153

 

Results for: Poplar.MTW(Year&Age = Y2A4)

 

One-way ANOVA: Weight versus Treatment

 

Analysis of Variance for Weight 

Source     DF        SS        MS        F        P

Treatmen    3    31.780    10.593    12.02    0.000

Error      76    67.002     0.882

Total      79    98.782

                                   Individual 95% CIs For Mean

                                   Based on Pooled StDev

Level       N      Mean     StDev  -----+---------+---------+---------+-

1          20    3.9315    1.1338           (----*----)

2          20    4.1320    0.5395             (-----*----)

3          20    3.2555    0.7797  (-----*----)

4          20    5.0205    1.1585                         (----*----)

                                   -----+---------+---------+---------+-

Pooled StDev =   0.9389               3.20      4.00      4.80      5.60

 

Dunnett's comparisons with a control

 

Grafico 7

 
    Family error rate = 0.0500

Individual error rate = 0.0190

 

Critical value = 2.40

 

Control = level (1) of Treatmen

 

Intervals for treatment mean minus control mean

 

Level        Lower    Center     Upper ----+---------+---------+---------+---

2          -0.5112    0.2005    0.9122          (------*------)

3          -1.3877   -0.6760    0.0357 (------*------)

4           0.3773    1.0890    1.8007                   (------*------)

                                       ----+---------+---------+---------+---

                                        -1.0       0.0       1.0       2.0

 

 

Tukey's pairwise comparisons

 

    Family error rate = 0.0500

Individual error rate = 0.0103

 

Critical value = 3.72

 

Intervals for (column level mean) - (row level mean)

 

                 1           2           3

 

       2     -0.9815

              0.5805

 

       3     -0.1050      0.0955

              1.4570      1.6575

 

       4     -1.8700     -1.6695     -2.5460

             -0.3080     -0.1075     -0.9840

 

 

 

Fisher's pairwise comparisons

 

    Family error rate = 0.200

Individual error rate = 0.0500

 

Critical value = 1.992

 

Intervals for (column level mean) - (row level mean)

 

                   1           2           3

 

       2     -0.7920

              0.3910

 

       3      0.0845      0.2850

              1.2675      1.4680

 

       4     -1.6805     -1.4800     -2.3565

             -0.4975     -0.2970     -1.1735

 

Dal confronto incrociato dei risultati dell’analisi della varianza del fattore Treatment, per tutto il campione e per ciascuno dei 4 strati, possiamo concludere che:

·        il fattore Treatment induce un effetto differenziale per la variabile Weight

o       tale effetto č dovuto alla differenza tra il livello del fattore Treatment corrispondente a Treatment =4, cioč “fertilizzante e irrigazione”, e tutti i restanti livelli (1=”nessun trattamento”, 2=”fertilizzante”, 3=”irrigazione”)

o       i restanti tre livelli sono tra loro indistinguibili

·        affinando l’analisi a ciascuno dei 4 strati definiti dalla variabile Year&Age possiamo aggiungere che

o       lo strato Year&Age =Y1A3 si comporta come l’intero campione

o       lo strato Year&Age =Y2A3 mostra un’unica differenza significativa tra il livello 3 e 4

o       lo strato Year&Age =Y1A4 si comporta come l’intero campione con in aggiunta un differenza significativa tra il livello 1 e 2

o       lo strato Year&Age =Y2A4 si comporta come l’intero campione con in aggiunta un differenza significativa tra il livello 2 e 3