Eventuali domande non presenti in questa lista possono essere inviate
all'indirizzo lettoreottico@libero.it.
Che cosa si intende per lettore ottico (OCR/ICR)?
Un sistema di elaborazione in grado di leggere dei caratteri presenti su un'immagine.
Per la lettura di caratteri scritti a mano si utilizzano sistemi ICR (Intelligent
Character Recognition), mentre per la lettura di caratteri stampati si utilizzano
sistemi OCR (Optical Character Recognition).
Come funziona un lettore ottico?
Attraverso l'utilizzo di tecniche di elaborazione e di analisi delle immagini
il lettore ottico processa le informazioni in esse contenute cercando
di riconoscere i caratteri presenti.
Quale è il ruolo di un lettore ottico in un sistema di acquisizione elettronica
di documenti cartacei ?
Facilitare un operatore umano nel processo di inserimento dei dati.
In che modo un lettore ottico può aumentare la qualità del processo di inserimento
dei dati da parte di un operatore umano e ridurre i tempi di lavorazione?
L'utilizzo di un lettore ottico lascia all'operatore umano il compito
di inserire solo i caratteri non riconosciuti correttamente, anziché tutti i dati
presenti sul documento da acquisire in formato elettronico.
Il lettore ottico sostituisce l'operatore umano?
ASSOLUTAMENTE NO! L'operatore verifica ed eventualmente corregge o integra quanto
riconosciuto dal lettore ottico. Se esistesse un lettore ottico infallibile o con
capacità equivalenti a quelle di un uomo, il suo inventore sarebbe immediatamente
candidato ad almeno un paio di premi Nobel (uno per il contributo fornito allo
studio della percezione visiva e un altro per aver costruito la prima macchina
in grado di superare il CAPTCHA TEST).
Ma allora perché si utilizzano i lettori ottici?
Il numero di caratteri da inserire può essere drasticamente ridotto grazie al lavoro
del lettore ottico, in questo modo l'operatore umano può concentrarsi sul processo
di interpretazione e verifica dei caratteri riconosciuti più che sul processo di
inserimento. Ciò ha l'effetto di migliorare la qualità delle informazioni inserite
e velocizzare le attività di data entry.
Può accadere che le informazioni derivanti da sistemi che utilizzano lettori ottici
possano risultare non corrette o non fruibili?
Esistono diversi casi possibili:
Chi ha compilato il modulo lo ha fatto correttamente, il lettore ottico
ha commesso un errore nel riconoscimento dei caratteri e l'operatore legge
male il suggerimento del lettore ottico per cui non corregge l'errore (è un
caso che si può verificare anche in assenza di lettore ottico, quando un
operatore legge male una scritta direttamente sul modulo).
Chi ha compilato il modulo ha inserito delle informazioni, il lettore ottico
le ha lette correttamente, l'operatore le ha verificate correttamente ma i
sistemi a valle non accettano l'informazione così come scritta dal compilatore
del modulo perché non rispondente a determinati requisiti logici o grammaticali.
In generale mentre i dati scritti su carta non hanno altro vincolo che il
numero dei caratteri utilizzabili, i sistemi che utilizzano quei dati possono
essere più rigidi per quanto riguarda le informazioni inserite. Ad esempio
un campo relativo alla cittadinanza può essere riempito con valori come
ITALIA, ITALIANO, ITALIANA, REPUBBLICA ITALIANA, ecc. mentre il sistema
che gestisce le informazioni acquisite può essere stato configurato per
riconoscere come valido solo il valore ITALIA. Un elemento fortemente critico
è quindi rappresentato dalla corretta gestione delle informazioni nel
passaggio tra sistemi diversi.
Chi ha compilato il modulo ha scritto dei caratteri, il lettore ottico ha
riconosciuto correttamente tali dati, ma l'operatore ha ritenuto opportuno
effettuare delle variazioni che risultano non essere corrette (si tratta
comunque di un caso estremamente raro).
E' possibile che un lettore ottico decida di non inserire nomi e cognomi perché
troppo complicati?
ASSOLUTAMENTE NO! Un lettore ottico non può sapere se un nome o un cognome è
complicato oppure no.
I lettori ottici sono sistemi allo stato sperimentale o appartengono ad un mercato
consolidato?
Le tecnologie di riconoscimento, nei limiti descritti sopra, si basano su decenni
di ricerca e hanno dato vita a prodotti venduti da numerose società (un elenco non
esaustivo lo si può trovare seguendo questo
link).
Perché si continua a parlare di problemi con il lettore ottico per l'elaborazione
dei moduli degli immigrati dando la colpa dei ritardi nell'emissione dei nulla
osta a presunti malfunzionamenti del medesimo?
Evidentemente non si conosce il processo di data entry descritto sopra
(che prevede sempre la verifica da parte di almeno un operatore umano), e si pensa
che qualcuno possa essere stato così avventato da far elaborare solamente ad un
sistema informatico un modulo scritto a mano contenente dei dati sensibili.
Se così fosse o le Poste o il Ministero dell'Interno o entrambi avrebbero deciso
di affidare esclusivamente ad una macchina l'inserimento dei dati il che sembra
essere altamente improbabile.
Che cosa si potrebbe dunque dire agli autori di alcuni articoli comparsi su
numerosi giornali*?
Che se i problemi fossero legati al lettore ottico sarebbero di facile e
immediata soluzione: un lettore ottico, se non utile, si può sempre dismettere.
Quando si scrivono degli articoli sarebbe opportuno documentarsi e non
scrivere da "più parti arrivano voci": non è corretto non citare le fonti dalle
quali si ricevono informazioni così delicate con giudizi tanto decisi.
Gli stranieri coinvolti nelle richieste meriterebbero più rispetto e meno
disinformazione.
*Di seguito si riporta una breve lista di articoli:
Giornale: La Repubblica.
Data: 20/05/2006.
Pagina: Prima pagina della cronaca di Roma.
Autore: Giovanna Vitale.