I sondaggi
Un sondaggio è un metodo per raccogliere delle informazioni sulla popolazione, attraverso una serie di domande poste direttamente ad un gruppo di persone scelte in rappresentanza di questa stessa popolazione.
La
selezione degli intervistati è fatta attraverso la tecnica statistica del
campionamento, il cui scopo finale è la costruzione del “campione”, cioè
di quel gruppo di persone che verrà intervistato a nome dell’intera
popolazione di riferimento e i cui risultati possano essere estesi all’intera
popolazione.
Ma
come si fa a formare un “campione” rappresentativo della popolazione che ci
interessa? Generalmente si segue il criterio-guida della “casualità”. In
virtù della teoria statistica delle probabilità, infatti, si sa che
l’estrazione casuale è il metodo che garantisce meglio di tutti che il gruppo
di persone rifletta fedelmente le caratteristiche della popolazione da cui è
estratto. Teoricamente il metodo dell’estrazione casuale prevede che ad ogni
estrazione ogni singola persona abbia le stesse probabilità di essere
selezionato.
E’
molto importante capire che “casuale” non vuol dire “a casaccio”, ma che
esiste una procedura precisa e rigorosa nella scelta dal campione. Il modo più
semplice è quello di riempire un urna con all’interno i nominativi di tutta
la popolazione ed estrarre a sorte; quello che otterremo è un campione
casuale semplice.
Un
altro sistema possibile è quello di stabilire un intervallo costante (ad
esempio 2000) fra i numeri da selezionare e di effettuare la selezione da un
numero estratto a sorte (ad esempio 7); in questo modo otterremo la selezione
dei numeri 7, 2007, 4007, ecc, ed avremo ottenuto quello che si chiama un campione
sistematico.
Se
un corretto campione (semplice o sistematico) garantisce che le principali
caratteristiche della popolazione in esame siano riprodotte praticamente nelle
proporzioni reali, volendo essere assolutamente certi che tali proporzioni siano
rispettate con precisione, dovremmo ricorrere ad un altro tipo di campionamento:
il campione stratificato. Questo si ottiene raggruppando i nomi della
lista in sottocategorie, o strati, in funzione di ciò che interessa mettere in
evidenza (età, regione di residenza, ecc.). All’interno di ogni strato si
effettua un campionamento con uno dei due metodi sopra menzionati, fino a
definire un campione particolarmente rappresentativo della popolazione ottenuto
sommando il risultati parziali dei vari campioni dei singoli strati.
Nel
caso non si possa campionare direttamente una popolazione per mancanza di dati
sulla stessa, si procede con un altro metodo statistico che prevede il continuo
sottoraggruppamento all’interno del quale campionare in modo semplice o
stratificato. Quello che si ottiene è chiamato campione multistadi a
grappoli che è in grado di rappresentare la popolazione in modo efficace,
pur senza aver usufruito del vantaggio di una lista di partenza.
Esiste
un altro metodo di campionamento possibile (campionamento per quote) che
però non è della stessa famiglia di quelli finora descritti in quanto non
prevede completamente l’utilizzo della casualità, ma unisce ad essa, con
criterio, la soggettività dell’intervistatore che sceglie chi poter
intervistare all’ interno di una “quota” di persone scelta con un metodo
statistico. A priori in questo metodo bisogna pianificare correttamente come
dividere la popolazione in quote e, in ognuna di queste, quante persone
ascoltare. Se quindi il piano è disegnato ed eseguito bene il risultato sarà
quello di un campione che riproduce in miniatura la composizione della
popolazione da esaminare. Ciò è vero, in realtà, solo per quelle
caratteristiche che sono state messe “in quota”.
I
sondaggi utilizzano una tecnica particolare per raccogliere le informazioni:
l’intervista, condotta attraverso questionari standardizzati, cioè identici
per tutti gli intervistati. Il sondaggio più semplice è costituito da una
singola domanda, più spesso, però si fonda su una “batteria” di domande
attinenti ad aspetti diversi di uno stesso problema.
Le
interviste possono essere realizzate con vari metodi, il più diffuso è
l’intervista telefonica, ma, con certi tipi di sondaggi, restano più
frequenti le interviste faccia a faccia o quelle autosomministrate in cui i
questionari stampati vengono compilati dagli intervistati stessi. Una variante
recente, ma in forte espansione è l’intervista telematica.
Un
caso particolare di somministrazione: I QUESTIONARI
Il
questionario è uno strumento d'indagine strutturato per la ricerca sociale, con
un'organizzazione definita nell'articolazione delle varie domande, che prevedono
risposte generalmente prefissate. E' questa una caratteristica che favorisce una
maggiore standardizzazione delle domande e delle risposte. Il questionario deve
essere visto come uno strumento di comunicazione finalizzato a facilitare
l’interazione fra il ricercatore, il rilevatore (se presente) e il
rispondente.
In
primo luogo il questionario deve essere ritenuto un insieme coerente di domande
rivolto all’accertamento e alla puntuale registrazione delle informazioni che
si intendono raccogliere e che possono riguardare dati fattuali, dati di
comportamento, dati di opinione e motivazioni.
In
secondo luogo il questionario deve evitare la possibilità (o almeno deve
tendere a ciò) che si ottengano risposte per effetto di preconcetti o
volontarie falsificazioni delle proprie opinioni. Per ottenere che il
questionario abbia tali caratteristiche è fondamentale che il ricercatore sia
informato sui molteplici aspetti del problema e del contesto in cui si accinge
ad indagare.
Ancora
sulle caratteristiche che devono contraddistinguere un questionario di
fondamentale rilevanza è ritenuta la disposizione delle domande. Infatti uno
dei problemi che ci si deve porre riguarda la difficoltà che incontra il
soggetto intervistato a dare risposte personali. Per evitare tale inconveniente
la redazione del questionario può prevedere domande iniziali tese a porre in
una condizione di maggiore confidenza l’intervistato.
Un
altro aspetto non marginale è l’attenzione che è utile prestare alla
relazione tra le domande e, quindi, alla loro sequenza, al fine di evitare
condizionamenti reciproci tra le domande da porre.
Infine è di grande rilevanza evitare effetti di
suggestione e ripetitività delle domande: ciò potrebbe provocare il cosiddetto
set di acquiescenza, vale a dire uno specifico fenomeno di remissivo adattamento
alle risposte.
Pur
rispettando tali prescrizioni, nella redazione di un questionario non si potrà
ritenerlo ancora valido se esso non sarà sperimentato attraverso una prima
operazione che viene definita pre-testing.
In
questa fase rilevatori
esperti intervistano un campione ragionato di individui per raccogliere elementi
utili a valutare completezza, chiarezza e gestibilità del questionario.
Il
pre-testing serve generalmente per correggere domande inutili, domande con
doppio significato, domande troppo lunghe o difficili, domande a cui cambiare
posizione o sequenza, domande formulate male, domande di difficile comprensione
ed eventuali cause di distorsione.
Nella
costruzione di un questionario va tenuto presente anche l'aspetto grafico con
cui viene presentato. Bisogna renderlo sempre il più chiaro e leggibile
possibile in modo che la sequenza delle domande e delle risposte non ingeneri
equivoci. Le domande non vanno sintetizzate e le eventuali
Indicazioni
per la compilazione devono essere immediatamente individuabili e comprensibili.
Classificazione delle
domande a seconda del loro contenuto:
domande
di informazione:
quanti sono coloro che sanno ..., quanti conoscono questo...
domande di opinione: quanti pensano
che ..., quanti sono favorevoli/contrari a..., quanti preferiscono che...
domande di comportamento o modi d'essere:
quanti fanno questo..., quanti appartengono a ..., quanti hanno ...
domande di motivazione: quanti
spiegano un comportamento con ..., quanti attribuiscono un loro atteggiamento
positivo/negativo a questo o quel motivo
domande di previsione o intenzione:
quanti intendono fare/acquistare questo o quello
Principali
tipologie di domande
Domande
chiuse:
sono quelle con risposte fissate in anticipo; l’intervistato può scegliere
esclusivamente tra le alternative proposte che sono esaustive sia in quanto non
esistono altre risposte possibili, sia in quanto il ricercatore non è
interessato ad eventuali alternative possibili.
Per esempio:
qual è il giorno della settimana che lei preferisce?
- lunedì
- martedì
- mercoledì
- giovedì
- venerdì
- sabato
- domenica
Domande
aperte:
lasciano
per l’appunto "aperta" qualsiasi possibilità di risposta.
Per
esempio:
quali sensazioni le provoca vedere le immagini di un disastro ferroviario?
(registrazione di quello che dice/scrive l'intervistato).
Permettono
cioè all’intervistato una totale libertà di espressione che determina una
elevata quantità di informazioni, ma minori garanzie sulla qualità laddove non
si possieda un intervistatore esperto in grado di giudicare la serietà della
risposta. Con questo tipo di domande ci si trova, comunque, di fronte ad un
difficile lavoro di codifica successiva per far rientrare il ventaglio di
risposte, certamente ampio, in una operazione di riduzione concettuale.
Per facilitare la lettura complessiva delle risposte raccolte, spesso queste verbalizzazioni vengono raggruppate in categorie da un ricercatore
Domande
strutturate:
che sono definite anche domande ad alternative fisse e offrono
all’intervistato la possibilità di scegliere tra una serie di risposte che
generalmente sono impostate sulla scorta delle conoscenze già acquisite sul
tema dell’indagine.
Per
esempio:
quali sono, tra i seguenti, i problemi più urgenti che il governo dovrebbe
affrontare? (3 risposte consentite)
- la lotta alla disoccupazione
- una nuova legge sugli immigrati
- le riforme istituzionali
- la lotta alla criminalità organizzata
- la riorganizzazione dei trasporti
- la lotta all'evasione fiscale
In
questo caso nelle alternative proposte è utile lasciare uno spazio ad altre
risposte che l’intervistato potrebbe dare.
Domande
filtro:
possono
essere sia delle domande chiuse che delle domande strutturate; si distinguono da
queste solo in quanto sulla base delle risposte ottenute, hanno la funzione di
filtrare i soggetti, ovvero di selezionarli in base alle modalità previste, per
dirigerli direttamente verso ulteriori specifiche domande da rivolgere solamente
a chi abbia determinate caratteristiche.
Modalità
di somministrazione
Le
più comuni sono:
L’autosomministrazione:
nel caso che la compilazione sia demandata totalmente al soggetto senza alcun
intervento esterno. E’ il caso dei questionari postali. I vantaggi maggiori di
questa modalità sono sintetizzabili nella possibilità di raggiungere un ampio
numero di soggetti anche in zone lontane tra loro. I pericoli sono il non poter
verificare se il compilatore è il destinatario e l’alta percentuale di
mancate risposte che spesso si riscontra.
(Esempio di questionario su carta)
L’intervista
con il questionario: è
il caso più frequente nella ricerca sociale. Il questionario viene
somministrato da un intervistatore appositamente addestrato.
L’intervista telematica: in questo caso l’intervistato
riceve il questionario a casa sul computer e risponde alle varie domande che
compaiono sullo schermo. Le risposte vengono poi trasmesse direttamente
all’istituto di ricerca.
PANEL: le persone che compongono il campione sono periodicamente
sottoposte alle stesse domande per misurare eventuali cambiamenti nelle loro
opinioni nel corso del tempo. Questo metodo viene per esempio utilizzato per
sondaggi preelettorali. Il fatto che siano sempre le stesse persone a rispondere
garantisce che i cambiamenti rilevati nei risultati non siano dovuti alla
diversità dei campioni utilizzati.
Intendiamo soffermarci brevemente sulle fasi operative
che vengono svolte una volta che si hanno a disposizione i dati relativi al
questionario/sondaggio.
Anzitutto si procede alla codifica dei quesiti aperti
intesa come l’attività’ di trasposizione di informazioni pervenute sotto
forma di linguaggio libero in un insieme finito di codici rispondenti ad una
classificazione precostituita.
Un
esempio di codifica è dato dalla trasposizione delle informazioni riguardanti
il settore di attività economica delle imprese, descritto in forma colloquiale
dal rispondente, nei rispettivi codici secondo la classificazione ATECO [Istat,
(1999)]. Un altro esempio è dato dalla codifica delle cause di morte secondo la
classificazione ICD-9 [ONU, (1977)] riportate sui certificati di morte, ed
utilizzate nell’ambito della corrispondente indagine amministrativa.
Il
ricorso ai quesiti aperti è motivato da quelle situazioni in cui il rispondente
non saprebbe collocare in modo corretto l’informazione secondo la
classificazione richiesta, a causa della sua notevole complessità. Infatti le
classificazioni ATECO e ICD-9 prevedono centinaia di codici differenti e
soltanto esperti codificatori sono in grado di risalire dall’informazione al
codice corrispondente. In questo caso, contrariamente a quanto si fa
normalmente, si rinuncia a precostituire una griglia di opzioni fisse che il
rispondente deve contrassegnare, preferendo al suo posto proporre una domanda
aperta.
A
causa della sua complessità l’operazione di codifica è da considerarsi
critica e deve essere demandata a personale appositamente formato. E’ appena
il caso di osservare come un esperto di una singola classificazione non
necessariamente lo è per una differente, magari riguardante soggetti diversi.
L’operazione di codifica avviene solitamente apponendo in un apposito spazio
il codice corrispondente alla descrizione riportata per esteso. Per quanto riguarda la possibilità che errori siano introdotti in
questa fase, oltre al fatto che il codificatore compia un errore di
interpretazione, si possono citare gli errori di trascrizione e quelli provocati
dall’inadeguatezza della classificazione stessa, ad esempio per sopravvenuta
obsolescenza.
Conclusa
questa fase si procede con le elaborazioni statistiche per le quali si
intende il processo di sommarizzazione ed interpretazione dei dati. Tale
processo coinvolge uno studio più approfondito di quello richiesto dalla
singola produzione di stime conclusive. L’elaborazione (o analisi) statistica
è importante per la predisposizione di nuove indagini sulla base dei risultati
di studi pilota o precedenti indagini, per la formulazione di obiettivi
realistici riguardanti la qualità, l’identificazione di problemi e di
requisiti del processo di produzione.
L’analisi
può anche richiedere l’esplorazione di questioni sociali e/o economiche
mediante l’esame di dati di fonti anche diverse.
Analisi dei
dati :
1.
Conduzione di analisi preliminari semplici mediante statistiche
descrittive quali quantili delle distribuzioni e istogrammi. Conduzione di
analisi esplorative per l’individuazione di assunzioni plausibili sui dati.
Test di adattamento finalizzati a valutare l’appropriatezza di distribuzioni
teoriche nell’adattamento ai dati. Uso di metodi di rappresentazione grafica.
2.
Uso di metodi robusti per la stima dei parametri. Applicazione di
tecniche diagnostiche della regressione. Valutare la bontà di adattamento del
modello ai dati
3.
Considerare nell’analisi i disegni di campionamento complesso
4.
Applicazione di studi tipo cross-validation dei dati per
analizzare se i risultati conseguiti con l’analisi possono essere considerati
sufficientemente generalizzabili
5.
Ricorrere ad esperti nell’applicazione dei singoli metodi statistici
utilizzati e condividere i risultati preliminari con lo staff di ricerca per
eliminare la probabilità degli errori ed imprecisioni più comuni nelle
interpretazioni delle analisi.
Infine
segue una fase detta di validazione attraverso quel processo attraverso
il quale si valuta se l'informazione può essere considerata consona alle
finalità per le quali è stata prodotta. Si dovranno predisporre le procedure
adatte alla misurazione dei parametri di qualità sui dati effettivamente
raccolti affinché si possa valutare il conseguimento degli obiettivi. Gli
obiettivi dell'operazione di validazione sono duplici: valutare se la qualità
dei dati è sufficiente ai fini della diffusione dell'informazione agli utenti;
identificare le fonti di errore più rilevanti e predisporre modifiche al
processo di produzione in modo da ridurre gli effetti degli errori in successive
occasioni di indagine.
le
principali misure di validazione sono:
1.
facilitare le valutazioni dell'utente documentando adeguatamente gli obiettivi
di qualità, le definizioni adottate e i processi predisposti;
2. condurre studi di coerenza fra i dati prodotti e il sistema dell'informazione
disponibile;
3. stimare le principali componenti del profilo dell'errore per mezzo di
apposite misurazioni della qualità e di indagini di controllo;
4. calcolare indicatori di qualità di processo finalizzati alla stima indiretta
della qualità dei dati.
Ovvero
riferendoci alla documentazione Eurostat in materia di valutazione della qualità
delle statistiche prodotte dai paesi membri della Comunità Europea.
1.
Rilevanza;
2.
Accuratezza;
3.
Tempestività e puntualità;
4.
Accessibilità e chiarezza (o trasparenza);
5.
Confrontabilità;
6. Coerenza;
7.
Completezza.
Non
esplicitamente compresa tra le caratteristiche richieste da Eurostat, ma
tuttavia parametro importante e frequentemente citato, si ritiene utile
includere la caratteristica di tutela della riservatezza dei rispondenti.
Diamo
nel seguito le definizioni per le caratteristiche citate:
- Rilevanza:
Capacità dell'informazione di soddisfare le esigenze conoscitive degli utenti.
Nell'accezione di utente si deve intendere anche i committenti preposti ad
organi di governo centrali o locali. È appena il caso di precisare che la
caratteristica di rilevanza è strettamente collegata con gli obiettivi di
indagine considerati in fase di progettazione;
- Accuratezza:
Grado di corrispondenza fra la stima ottenuta dall'indagine e il vero (ma
ignoto) valore della caratteristica in oggetto nella popolazione obiettivo. I
motivi che possono causare delle cadute nell'accuratezza dell'informazione sono
denominate fonti dell'errore mentre una sua misura viene fornita dall'
errore totale;
- Tempestività
e puntualità: Intervallo di tempo intercorrente fra il momento della
diffusione dell'informazione prodotta e l'epoca di riferimento della stessa.
Tempi e costi di un processo di produzione sono strettamente in relazione fra
loro;
- Accessibilità
e chiarezza: Nota anche col nome di "trasparenza", questa
caratteristica corrisponde alla semplicità per l'utente di reperire, acquisire
e comprendere l'informazione disponibile in relazione alle proprie finalità.
Queste caratteristiche sono influenzate dal formato e dai mezzi di diffusione
dell'informazione rilasciata nonché dalla disponibilità di meta-informazioni a
suo corredo;
- Confrontabilità:
Possibilità di paragonare nel tempo e nello spazio le statistiche riguardanti
il fenomeno di interesse. Il grado di confrontabilità è influenzato, oltre che
dalle modificazioni concettuali che possono intervenire nel tempo e nello
spazio, anche da cambiamenti intervenuti nelle definizioni e/o nelle
caratteristiche operative adottate dal processo di produzione dell'informazione.
È ovviamente sul controllo di queste ultime che occorre concentrarsi per
aumentare al massimo la confrontabilità dell'informazione prodotta;
- Coerenza:
Per le statistiche derivanti da una singola fonte la coerenza corrisponde alla
possibilità di combinare le inferenze semplici in induzioni più complesse.
Qualora derivanti da fonti diverse, ed in particolare per informazioni prodotte
con diversa periodicità, le statistiche possono essere considerate coerenti
fintantoché basate su definizioni, classificazioni e standard metodologici
comuni. In tal caso le inferenze possibili all'utente saranno più facilmente
interrelate o, perlomeno, non risulteranno in contrasto fra loro.
- Completezza:
Si tratta di una caratteristica trasversale ai singoli processi e consiste nella
capacità di questi integrarsi per fornire un quadro informativo soddisfacente
del dominio di interesse. A loro volta i domini per i quali sono rese
disponibili statistiche dovrebbero riflettere le necessità e le priorità
espresse dagli utenti del Sistema Statistico Nazionale (SISTAN).
http://www.istat.it/ Istituto Nazionale di Statistica
http://www.ring.lombardia.it/ Annuario statistico Regionale Lombardia
http://cens.istat.it/ Censimento intermedio dell’industria e dei servizi
http://demo.istat.it/ Statistiche demografiche Popolazione residente comuni italiani
http://cidoc.iuav.it/sintesi/ Servizio statistico che riporta dati istat a livello nazionale
http://www.lom.camcom.it/ Camere di commercio (Lom)
http://petra.istat.it/metadati/lineeg/lg.html Linee guida metodologiche per rilevazioni statistiche (ISTAT)
http://www.peopleswg.it/aiuta/index.html Peopleswg (società per le ricerche di mercato)
http://www.swgbologna.it/metodi/metodi.htm Swg Bologna Ricerche e Sondaggi
www.hermescuole.na.it/scuole/narcdesanctis/dispersione/socioculturale.htm#questionario Hermes scuole
Software disponibili
http://www.agenziaentrate.it/settore/questionari/quest2000/index2000_1.htm
www.grimmersoft.com/us/home.htm