Esempio 1
Allo scopo di massimizzare la produzione di una pianta dalle caratteristiche particolarmente interessanti chiamata Poplar, ricercatori della Pennsylvania State University piantarono alcuni esemplari di “Poplar Clone 252” presso due differenti siti di coltura:
· Sito 1: suolo fertile ed umido nei pressi di un torrente
· Sito 2: suolo secco e sabbioso presso il crinale di un monte
Presso entrambe i siti, furono applicati quattro trattamenti alternativi di coltivazione:
· Trattamento 1: nessun trattamento (controllo)
· Trattamento 2: fertilizzante
· Trattamento 3: irrigazione
· Trattamento 4: fertilizzante e irrigazione
Per tener conto delle diverse condizioni atmosferiche furono piantati, a distanza di un anno l’uno dall’altro, due distinti campioni di piante: il primo anno il campione fu di 146 unità ed il secondo anno di 152 unità.
Sia nel primo che nel secondo campione vi erano piante già adulte. In particolare nel primo campione 71 delle 146 piante avevano già un anno di età mentre nel secondo campione 72 avevano 1 anno e 80 ne avevano 2. In questo modo alla fine dell’esperimento si era riusciti a tener conto di tutti le possibili variabili di interesse, combinate tra loro, concernenti la crescita e lo sviluppo della pianta in questione.
Dopo quattro anni dall’inizio dell’esperimento, per ciascuna pianta sono stati rilevate le seguenti variabili:
·
sito di coltivazione (1, 2)
· anno di avvio della coltura (1, 2)
· tipo di trattamento (1, 2, 3, 4)
· diametro dell’albero, in centimetri
· altezza dell’albero, in centimetri
· peso del legno essiccato, in chilogrammi
· età dell’albero, in anni (3, 4)
Condurre un’analisi esplorativa, con la metodologia della statistica descrittiva, dei dati a nostra disposizione tenendo presente che l’attenzione deve essere focalizzata sulle variabili diametro, altezza e peso, che riassumono il contributo che l’insieme dei diversi fattori di coltura hanno apportato alla crescita e sviluppo della pianta.
Ulteriore obiettivo è quello di riuscire a ottenere qualche indizio circa l’influenza che i fattori di coltivazione sito e trattamento hanno sul volume di produzione della pianta.
Avviare MINITAB ed aprire il worksheet “Poplar”, memorizzato nella cartella “Dati”.
Prima di procedere con la creazione e l’analisi delle statistiche descrittive verifichiamo che la composizione del nostro campione, dal punto di vista del sito di coltura, dell’anno di semina e dell’età della pianta, corrisponda alle informazioni sopra riportate. A questo scopo utilizziamo la funzione Tables:
ü Stat > Tables> Cross Tabulation
ü una per volta selezionare le variabili Site, Age e Year (in questo ordine) e portale nel box Classification variables facendo clic su Select
ü OK
I dati forniti circa la composizione del campione corrispondono a quanto risulta dalla tabella fornita dalla Session window.
Passiamo alla creazione di una serie di statistiche descrittive.
ü Stat > Basic Statistics > Display Descriptive Statistics
ü selezionare le variabili C4 (Diameter), C5 (Heigth), C6 (Weight)
ü clic su Select
ü clic su Graphs, attivare le opzioni Histogram of data with normal curve
ü OK, OK
Osservando i tre grafici possiamo
dedurre le seguenti considerazioni:
· nessuna delle tre variabili segue in maniera convincente il pattern della distribuzione normale (Weight in particolare, Grafico 1)
· tutti gli istogrammi sembrano evidenziare la presenza di (almeno) due distribuzioni che si sovrappongono in parte tra loro (molto evidente in Weight)
·
Grafico 1
è plausibile che la causa di tale fenomeno sia dovuto
all’influenza che i diversi fattori di coltura sul campione di piante: esso non
è omogeneo ma presenta dei sottogruppi con comportamenti diversi tra loro.
Ricordiamo che in condizioni standard le variabili di tipo biometrico, come
sono queste, seguono solitamente la distribuzione normale
Concentriamoci sulla variabile Weight, che è d'altronde la più rilevante nella valutazione dell’efficienza dei trattamenti di cultura.
Con l’ausilio del grafico Box Plot cerchiamo qualche indizio che possa chiarire quale sia il fattore, tra i trattamenti di cultura Site e Treatment, maggiormente responsabile per la situazione appena osservata.
ü Stat > Basic Statistics > Display Descriptive Statistics
ü rimuovere le variabili C4 (Diameter), C5 (Heigth), dal box Variables
ü attivare l’opzione By variable, portare il cursore nella casella adiacente, selezionare la variabile Site
ü Clic su Select
ü Clic su Graphs, attivare l’opzione Boxplot of data e disattivare la precedente opzione
ü OK, OK
Ripetere la procedura per il secondo fattore di trattamento dato dalla variabile Treatment.
Inaspettatamente nessuno dei fattori di coltura è direttamente responsabile del comportamento manifestato dalla variabile Weight nel suo istogramma di frequenze.
Non rimane che analizzare il rapporto tra Weight e le variabili Year ed Age, introdotte nell’esperimento allo scopo di tener conto dei fattori stagionali, la prima, e dell’età di raccolta della pianta, la seconda.
ü Graph > Histogram
ü Selezionare Weight, clic su Select
ü Nel box Data display, impostare For each = Group
ü Attivare la casella Group variables, selezionare Year e fare clic su Select
ü
OK, OK
Ripetere la procedura la variabile Age.
Dall’analisi dei grafici risulta evidente che le variabili Year ed Age determinano inequivocabilmente l’andamento a “due gobbe” della variabile Weight.
A causa del particolare disegno sperimentale questi due fattori sono direttamente connessi l’uno all’altro e quindi per stabilirne correttamente il rapporto dell’uno con l’altro, sempre per meglio caratterizzare la variabile Weight, decidiamo di codificare una nuova variabile, con il nome Year&Age, che può naturalmente assumere 4 valori.
ü Manip > Code > Numeric to Text
ü Completare la finestra di dialogo analogamente alla Figura 1
ü OK
ü Nominare la colonna C10 con l’etichetta Year&Age
ü Manip > Concatenate
ü Completare la finestra di dialogo analogamente alla Figura 2
ü OK
ü
Eliminare le colonne c8 e c9
Fig. 2 Fig. 1
Per verificare se la stratificazione del nostro campione in questi 4 gruppi risulta o meno significativa costruiamo un ulteriore grafico:
ü Graph > Dotplot
ü Selezionare Weight, clic su Select
ü Nel box By variable, impostare Year&Age
ü
OK
Grafico 6
Riscontriamo che i 4 strati del nostro campione rivelano in effetti una manifestano della variabile Weight nettamente distinta.
Calcoliamo nel dettaglio le statistiche descrittive e i grafici Istogramma delle frequenze e Boxplot per ciascuno strato:
ü Stat > Basic Statistics > Display Descriptive Statistics
ü nel box Variables dovrebbe già trovarsi la variabile Weight; attivare l’opzione By variable, e selezionare la variabile Year&Age
ü Clic su Graphs, attivare l’opzione Graphical summary e disattivare la precedente opzione
ü
OK, OK
Suddividiamo il nostro worksheet in 4 sottoinsiemi di dati in base alla variabile Year&Age.
ü Manip > Split Worksheet
ü By variable = Year&Age
ü
OK
Prendiamo in considerazione il sottocampione Year&Age=Y2A3, facendo clic sul worksheet corrispondente, e riproviamo a testare l’influenza dei fattori di cultura Site e Treatment.
A differenza di quanto osservato sul campione globale, all’interno di questo strato possiamo affermare che il Sito 2 e il Trattamento 4 sono sensibilmente influenti sulla peso della pianta e quindi influenzano positivamente la sua produttività.
Al termine di questa serie di analisi statistiche possiamo concludere che:
· l’età della pianta (Age) e l’anno di avvio della coltura (Year) costituiscono dei fattore fortemente discriminante per il valore e la distribuzione della variabile Weigth, e quindi per livello di produttività della pianta nel senso che piante piantate il secondo anno dall’inizio dell’esperimento e/o piante dell’età di 4 anni sembrano essere notevolmente più produttive di quelle piantate il primo anno e/o piante dell’età di 3 anni
· le variabili Site e Treatment non sono apparentemente molto determinanti nello sviluppo e crescita dalla pianta
· considerando separatamente i 4 strati, definiti dalle combinazioni di Year e Age, le variabili Site e Treatment si sembrerebbero dimostrarsi invece efficaci per la produttività della pianta