Manipolare e calcolare
SOMMARIO
Trasporre righe e colonne e
viceversa
Impilare (Stacking) e Disimpilare
(Unstacking)
Calcolare espressioni matematiche e
trasformazioni
Calcolare statistiche individuali
per colonne e righe
Estrarre componenti dalle colonne
Date/Time
Riempimento automatico (Autofill)
Replicazione degli Appunti
(Clipboard)
Funzione Crea Dati Modellizati
Creare variabili indicatore (Dummy)
Dati casuali e distribuzioni di probabilità
Quando le procedure di copia e spostamento dei dati cominciano a diventare ripetitive e laboriose, se non anche troppo difficoltose, MINITAB offre una serie di funzionalità aggiuntive molto utili per la manipolazione intensa dei dati.
Possiamo classificare tali funzioni secondo le seguenti classi:
· Unire (Merging) Worksheets: dall’unione di due worksheet crearne uno unico
· Creare Sottinsiemi (Subset) di dati: Copiare (Copy) parte di un worksheet o suddividere (Split) un worksheet in due o più nuovi worksheet
· Organizzare i dati: Ordinare (Sorting), Ordinare secondo un valore (Value Ordering) e Creare Rangi (Ranking) dai dati
· Trasporre le colonne in righe e viceversa
· Impilare (Stacking) e Disimpilare (Unstacking) i dati in diversi modi secondo colonne o blocchi di colonne
· Combinare colonne di testo: concatenare due o più colonne di testo per creare una nuova variabile
Tale funzione permette di duplicare e combinare due worksheet aperti in maniera completa o parziale.
La procedura è la seguente:
1. attivare uno dei due worksheet che si vogliono unire
2. scegliere Manip > Merge Worksheet
3. in With fare clic sul nome del worksheet che si vuole unire al worksheet attivo
4. eventualmente specificare il nome del nuovo worksheet nella casella Output worksheet name
5. eventualmente usare alcune delle opzioni:
o By Column: opzioni per escludere / includere delle righe in base a diverse condizioni
o Include Column: opzioni per escludere / includere delle colonne
6. fare clic si OK
Esistono due modalità per la creazioni di sottoinsiemi di dati:
1. copiare righe da un foglio attivo in un nuovo worksheet attraverso la funzione Subset Worksheet
2. suddividere il foglio attivo in due o più o più nuovi worksheet attraverso la funzione Split Worksheet
La procedura è la seguente:
1. attivare il worksheet di cui si vogliono copiare delle righe
2. scegliere Manip > Subset Worksheet
3. se si desidera, specificare un nome per il nuovo worksheet
4. nel riquadro Include or Exclude attivare l’opzione desiderata
5. nel riquadro Specify Wich Rows to Include or Exclude scegliere l’opzione desiderata, nel caso
o Rows that match, fare clic su Condition e completare la finestra di dialogo per definire l’espressione
o Brushed rows, sulla base dei punti selezionati da un grafico
o Row numbers, per specificare righe specifiche
6. fare clic si OK
La procedura è la seguente:
1. attivare il worksheet di cui si vogliono copiare delle righe
2. scegliere Manip > Split Worksheet
3. nel riquadro By variable specificare almeno una variabile; MINITAB creerà tanti nuovi worksheet quanti valori distinti ci sono in By Column(s). Tali colonne devono essere di uguale lunghezza
4. fare clic si OK
Si possono organizzare i dati in diverse maniere:
1. Ordinare (Sorting) alfabeticamente o numericamente una o più colonne attraverso la funzione Sort
2. Assegnare ranghi (Ranking) ai valori in una colonna attraverso la funzione Rank
3. Organizzare una o più colonne di testo in accordo un ordine predefinito attraverso la funzione Value Ordering
4. fare clic si OK
Ordinando alfabeticamente o numericamente una o più colonne l’ordine si realizza anche su tutte le altre colonne del dataset, che devono necessariamente essere tutte della stessa lunghezza, in modo che le modalità associate alla stessa unità statistica rimangono allineate lungo la stessa riga.
La procedura è la seguente:
1. scegliere Manip > Sort
2. in Sort column(s) inserire la/e colonna/e che si vogliono ordinare
3. in Store sorted column(s) inserire le colonne in cui si vogliono immagazzinare i dati ordinati; digitare le stesse colonne di origine se dell’istruzione al p.to 2 se non si desidera salvare le colonne non ordinate
4. in Sort by column inserire almeno una e al massimo 4 colonne secondo la/le quale/i si vuole realizzare l’ordinamento; per impostare un ordine discendente selezionare la corrispondente opzione Descending
5. fare clic si OK
Assegnare un rango ad una colonna significa attribuire a ciascun valore della colonna, a partire dal più piccolo, un punteggio (score) dato da un numero crescente in successione aritmetica a cominciare da 1 (1, 2, 3, …).
La procedura è la seguente:
1. scegliere Manip > Rank
2. in Rank data in inserire la colonna per la quale si vuole calcolare il rango
3. in Store ranks in inserire la colonna in cui si vogliono immagazzinare i ranghi e fare clic si OK
Tale procedura serve a controllare in quale ordine MINITAB realizzerà i propri comandi (come la creazione di un grafico) in relazione a dati in formato testo di tipo categoriali (ad es. mesi, giorni, giudizi, …) che risultano per default ordinati in ordine alfabetico. Notare che la realizzazione della procedura di Value Ordering non appare in alcun modo nel Data window.
La procedura è la seguente:
1. nel Data window fare clic su di una cella della colonna di testo che si vuole riarrangiare
2. scegliere Editor > Column > Value Order
3. scegliere una delle 3 opzioni
o Alphabetical order: (normale opzione di default)
o Order of occurrence in worksheet: l’ordine viene definito dal valore presente nella prima riga, dal successivo valore distinto e così via
o User-specified order: permette di selezionare un particolare tipo di ordine dal box Choose an order o definirne uno di nuovo (NEW ORDER)
4. fare clic si OK
Per riarrangiare i dati trasponendo le colonne in righe è disponibile il comando Switch secondo la seguente procedura:
1. scegliere Manip > Traspose Column
2. in Tanspose the following colums, inserire le colonne da trasporre
3. sotto Store transpose scegliere la destinazione per le colonne trasposte, secondo le opzioni
o In new worksheet (se si desidera digitarne anche il nome in Name)
o After last column in use (se si desidera specificare anche una colonna da cui estrarre le intestazioni per le colonne trasposte)
4. fare clic si OK
Viceversa per riarrangiare i dati trasponendo le righe in colonne è disponibile il comando Stack Rows. Le colonne devono essere dello stesso tipo e di uguale lunghezza.
La procedura è la seguente:
1. scegliere Manip > Stack > Stack Rows
2. in Rows to be stacked are in the following columns, inserire le colonne che contengono le righe che saranno trasposte in un’unica colonna
3. in Store stacked data in, inserire il numero o il nome del la colonna di destinazione della trasposizione; se si desidera scegliere tra le opzioni
o Store the row subscripts: crea una colonna con un indicatore della riga di provenienza
o Store the column subscripts: crea una colonna con un indicatore della colonna di provenienza
o Expand column …: espande una certa colonna mentre traspone le righe in colonne che eventualmente viene memorizzata in una nuova colonna
4. fare clic si OK
Esistono tre modi per Impilare e Disimpilare i dati
1. Impilare colonne (Stacking Columns)
2. Impilare blocchi di colonne (Stacking Blocks of Columns)
3. Disimpilare (Unstacking)
Si utilizza la funzione Stack Columns per spostare i dati da due o più colonne in una solo colonna più lunga, all’interno del worksheet corrente oppure in un nuovo worksheet.
Quando si impilano delle colonne è possibile anche creare una colonna di identificatori (subscripts) che indica la colonna di provenienza dell’osservazione; si possono utilizzare tali indicatori allo scopo di:
· suddividere i dati
· creare grafici dipendenti dagli identificatori di gruppo
· disimpilare le colonne
Le colonne possono contenere dati in qualsiasi formato e non essere necessariamente di uguale lunghezza.
La procedura è la seguente:
1. scegliere Manip > Stack > Stack Columns
2. in Stack the following columns, inserire le colonne che contengono i dati da impilare; le colonne vengono impilate dall’alto verso il basso a partire dalla prima colonna inserita
3. in Store stacked data in, inserire la posizione della colonna di destinazione dell’impilamento:
o scegliere New worksheet per creare la colonna impilata in un nuovo worksheet; se si desidera specificarne il nome
o scegliere Column of current worksheet per posizionare la colonna impilata nel worksheet corrente in una colonna da specificare
o eventualmente selezionare l’opzione Store subscripts in e Use variable names in subscripts column per specificare le modalità di creazione della colonna di indicatori
4. fare clic si OK
Si utilizza la funzione Stack Blocks of Columns per spostare due o più blocchi di dati da due o più colonne due o più colonne più lunga, all’interno del worksheet corrente oppure in un nuovo worksheet.
La procedura è la seguente:
1. scegliere Manip > Stack > Stack Block of Columns
2. in Stack two or more blocks of columns on top of each other, inserire ogni blocco di colonne da impilare
3. in Store stacked data in, inserire la posizione della colonna di destinazione dell’impilamento:
o scegliere New worksheet per creare i blocchi impilatati in un nuovo worksheet; se si desidera specificarne il nome
o scegliere Column of current worksheet per posizionare i blocchi impilatati nel worksheet corrente in colonne da specificare
o eventualmente selezionare l’opzione Store subscripts in e Use variable names in subscripts column per specificare le modalità di creazione della colonna di indicatori
4. fare clic si OK
A partire da una colonna impilata o da blocchi di colonne impilate si utilizza la funzione Unstack Columns per suddividere il contenuto, ed eventualmente copiarlo in un nuovo worksheet, in forma di due o più colonne più corte.
La procedura è la seguente:
1. scegliere Manip > Unstack Columns
2. in Unstack the data in, inserire le colonne o i blocchi di colonne da disimpilare
3. in Using subscripts in, inserire la colonna contenente gli indicatori che determineranno come la colonna o i blocchi di colonne saranno suddivisi
4. in Store unstacked data, inserire la posizione delle nuove colonne disimpilate
o scegliere New worksheet per creare le nuove colonne disimpilate in un nuovo worksheet; se si desidera specificarne il nome
o selezionare After last column in use per posizionare le nuove colonne disimpilate nel worksheet corrente dopo l’ultima colonna che contiene dati
5. fare clic si OK
Si utilizza la funzione Concatenate per combinare due o più colonne di testo e memorizzarne il contenuto in una nuova e più ampia colonna.
I dati devono essere in formato testo e le colonne di uguale lunghezza.
La procedura è la seguente:
1. scegliere Manip > Concatenate
2. in Concatenate text columns, inserire le colonne di testo da concatenare nell’ordine opportuno
3. in Store result in, inserire la colonna che memorizzerà la nuova colonna concatenata
4. fare clic si OK
Si utilizza il comando Code per ricodificare una o più colonne, cioè per ridefinirne i valori in base a certe condizioni, in una o più nuove colonne.
La procedura è la seguente:
1. scegliere Manip > Code > Numeric to Numeric, Numeric to Text, Text to Text o Text to Numeric a seconda del tipo di colonna di origine e di destinazione della ricodifica
2. in Code data from columns, inserire la/e colonna/e da ricodificare
3. in Into columns, inserire la/e colonna/e in cui immagazzinare i dati ricodificati
4. in Original values, inserire i valori dei dati da ricodificare, eventualmente usando i due punti “:” per definire un intervallo
5. in New, specificare il nuovo valore che sostituisce il/i valore/i originale/i
6. fare clic si OK
Quando l’operazione di codifica è particolarmente laboriosa si può utilizzare la procedura Manip > Code > Use Conversion Table: il procedimento di conversione si basa su una coppia di colonne affiancate, che deve essere precedentemente costruita nel worksheet corrente, dove si specificano i valori originari e i nuovi valori.
Allo scopo di effettuare dei calcoli a partire dai dati del worksheet MINITAB mette a disposizione una serie di funzionalità:
· il Calcolatore (Calculator)
·
Statistiche per righe e colonne
· Standardizzare (Standardize)
·
Estrarre da colonne Date/Time
L’utilizzo del Calculator permette di realizzare operazioni matematiche, logiche e operazioni tra colonne. Le espressioni possono includere colonne, costanti già memorizzate, numeri, testo ma non matrici.
La procedura è la seguente:
1. scegliere Calc > Calculator
2. in Store results in variable, inserire la colonna o la costante in cui immagazzinare il risultato dell’espressione; se si vuole creare una nuova colonna digitarne il numero, come C10 o C11, oppure un nome che ancora non esiste
3. con il cursore nel riquadro Expression, selezionare i nomi delle variabili, i pulsanti, e le funzioni per costruire l’espressione desiderata
4. fare clic si OK
Si possono calcolare varie statistiche a partire da colonne o righe individuali. La differenza dell’utilizzo di questa procedura per calcolo delle statistiche rispetto al Calculator è che qui per le statistiche di colonna i risultati sono memorizzati nella Session window e non nel worksheet.
La procedura è la seguente:
1. scegliere Calc > Column Statistics oppure Calc > Rows Statistics
2. in Statistics, scegliere la particolare statistica che si vuole calcolare
3. in Input variable/s, inserire la colonna dei dati (per Column Statistics) oppure la serie di colonne che contengono le righe (per Rows Statistics) per la/le quali si vogliono calcolare le statistiche
4. in Store results in, inserire una costante per Column Statistics o invece una colonna in cui immagazzinare i risultati per Rows Statistics
5. fare clic si OK
Standardizzare i dati significa ridefinire i valori di una variabile omogenei dal punto di vista del loro valore centrale e dell’unità di misura in modo da rendere confrontabili variabili che altrimenti non sarebbero paragonabili tra loro.
La procedura è la seguente:
1. scegliere Calc > Standardize
2. in Input column(s), inserire le colonne da standardizzare
3. in Store results in, inserire le colonne in cui archiviare i valori standardizzati
4. selezionare il metodo di standardizzazione tra quelli disponibili
5. fare clic si OK
È possibile estrarre una o più parti di una colonna Date/Time, come l’anno, il quadrimestre o l’ora, e salvarla sia in una colonna numerica che testo.
La procedura è la seguente:
1. scegliere Calc > Extract from Date/Time to Numeric oppure Calc > Extract from Date/Time to Text
2. in Extract from date/time column, inserire la colonna da standardizzare
3. selezionare la componente da estrarre tra quelli disponibili
4. fare clic si OK