L'indice di leggibilità che ha avuto maggiore successo e diffusione è quello di Rudolf Flesch, messo a punto nel 1948 e noto come Indice di Flesch. Esso considera due variabili linguistiche: la lunghezza della parola (numero di sillabe) e la lunghezza media della frase (numero delle sue sillabe diviso il numero delle parole).
I risultati della formula oscillano su una scala di valori compresi tra 0 e 100, dove il valore "100" indica la leggibilità più alta e "0" la leggibilità più bassa.
Data la sua semplicità d'uso, l'indice può essere utilizzato per analizzare sia testi brevi che testi lunghi. In quest'ultimo caso è necessario operare su una campionatura del testo.
Questo indice valido per la lingua inglese, è stato tarato sulla struttura morfologica e sillabica di questa lingua.
Nel 1972 Roberto Vacca, che diffuse in Italia l'Indice di Flesch, adattò alla lingua italiana la formula, ritoccando le costanti. La formula dell'Indice di Flesch per la lingua italiana è la seguente:
Indice di Flesch = 206 - (0,6 × S) - P
dove: S = numero di sillabe sul totale delle parole e P = numero medio di parole per frase
Nella lingua italiana la semplicità d'uso dell'indice si riduce a causa del diverso sistema di sillabazione delle parole. Il problema del calcolo delle sillabe si complica soprattutto quando si passa al calcolo automatico. Esso può essere risolto ricorrendo a stime statistiche sul numero dei gruppi vocalici e consonantici, il cui limite è quello di non poter descrivere e riprodurre esattamente la sillabazione delle singole parole di un testo. Perciò, i ricercatori hanno pensato di aggirare questo problema costruendo indici che utilizzassero le lettere come unità di misura della lunghezza delle parole, e non le sillabe.
L'Indice Gulpease è una delle cinque formule realizzate nel 1988 nell'ambito delle ricerche del GULP (Gruppo Universitario Linguistico Pedagogico) presso il Seminario di Scienze dell'Educazione dell'Università di Roma, con la supervisione di Maria Corda Costa e Tullio De Mauro e in collaborazione con l'IBM Italia. La rilevazione dei dati utilizzati nella costruzione dell'Indice Gulpease è stata effettuata nell'ambito di un seminario intercattedra, svolto tra il 1986 e il 1987 dalle cattedre di Filosofia del linguaggio e di Pedagogia dell'Istituto di Filosofia dell'Università di Roma «La Sapienza».
Come l'Indice di Flesch, anche il Gulpease considera due variabili linguistiche: la lunghezza della parola (espressa dalla media del numero di lettere) e la lunghezza della frase (espressa dal numero medio di parole per frase). La formula dell'indice è la seguente:
Indice Gulpease = 89 - (Lp / 10) + (3 × Fr)
dove: Lp = (100 × totale lettere) / totale parole e Fr = (100 × totale frasi) / totale parole
I risultati della formula oscillano su una scala di valori compresi tra 0 e 100, dove il valore "100" indica la leggibilità più alta e "0" la leggibilità più bassa.
Data la sua semplicità d'uso, l'indice può essere utilizzato per analizzare sia testi brevi che testi lunghi: in quest'ultimo caso è necessario operare su una campionatura del testo.
L'Indice Gulpease è il primo indice di leggibilità tarato sulla lingua italiana e ha il vantaggio di calcolare la lunghezza delle parole in lettere, anziché in sillabe. Proprio quest'ultima caratteristica ha consentito di tradurre nel programma AUTOGULP e in Èulogos SLI la procedura di calcolo dell'indice ottenendo un buon livello di affidabilità.
Il calcolo automatico di un indice di leggibilità comporta la risoluzione di diversi problemi, dovuti essenzialmente alla cecità delle procedure automatiche rispetto al contenuto del testo. La soluzione adottata nel programma AUTOGULP e in Èulogos SLI, elaborata da Maurizio Amizzoni, consiste nel costruire un modello matematico del testo.
(Per approfondimenti: Èulogos srl Ingegneria della lingua italiana Nicola Mastidoro e Maurizio Amizzoni, LINGUISTICA APPLICATA ALLA LEGGIBILITÀ: CONSIDERAZIONI TEORICHE E APPLICAZIONI )
pagina a cura di
Roberto Ricci
, Liceo S. "A.Righi" Bologna.
Ultima revisione