Speciale tecnologia: cosa significa la sigla ICR?

I software ICR (Intelligent Character Recognition) rappresentano per molti versi la frontiera finale dei sistemi di lettura ottica. Se i sistemi OCR sono in grado di interpretare i caratteri stampati, infatti, lo scopo delle tecnologie ICR è quello di permettere il riconoscimento ottico dei caratteri scritti a mano, il che renderebbe possibile – con la combinazione delle due metodologie – digitalizzare davvero qualsiasi genere di documento. Sebbene la ricerca abbia ancora molta strada da fare, i sistemi ICR sono in grado di ottenere buoni risultati sui dati scritti a mano in stampatello.

Le tipologie di software ICR

È possibile distinguere i software di lettura ottica ICR in due grandi famiglie o categorie, in base al livello di “tolleranza” del sistema stesso rispetto alla qualità della scrittura a mano da interpretare. Abbiamo infatti da un lato i sistemi ICR cosiddetti constrained: questi software possono effettuare il riconoscimento di caratteri scritti a mano e in stampatello solamente se i caratteri risultano completamente separati fra loro. I sistemi ICR unconstrained, più evoluti, permettono invece una maggiore applicazione, dato che sono in grado di interpretare i caratteri in stampatello scritti a mano anche qualora questi si tocchino in alcuni punti.

Come funziona la tecnologia ICR

Come si è detto, la tecnologia ICR è quella più recente e con ancora più strada da fare nel campo della lettura ottica, e ha per ora funzioni ancora abbastanza limitate. Il processo di interpretazione dei caratteri scritti a mano in stampatello è affidato a dei sistemi di intelligenza artificiale basati sulle reti neuronali, che effettuano fondamentalmente il controllo e la comparazione dei caratteri scritti con i modelli immagazzinati nei propri archivi; la qualità e la specificità di tali modelli – che variano significativamente fra lingua e lingua, ma anche fra zone geografiche – sono l’elemento fondamentale per il buon funzionamento del software ICR.

I tipi di documenti su cui è opportuno usare i sistemi ICR

Poiché sono in grado di interpretare i dati scritti a mano solamente se questi sono in stampatello, e il livello di correttezza del riconoscimento sale drasticamente quando questi sono ben distinti e separati sul foglio, i software di lettura ottica ICR si dimostrano adatti soprattutto all’acquisizione e digitalizzazione del contenuto di moduli a caselle prestampate compilati a mano, come moduli d’iscrizione, schede anagrafiche, bollettini postali e documenti simili.

I limiti dei software ICR

Come è già emerso da quanto detto finora, la tecnologia ICR è quella che si trova di fronte alle maggiori difficoltà e complicazioni fra tutti i sistemi di lettura ottica. Tale problema nasce dalla varietà enorme di scritture esistenti, combinata con la scarsa precisione degli scriventi nel ripetere esattamente la forma di un carattere di volta in volta.

Innanzitutto, quindi, i sistemi ICR devono essere programmati in maniera estremamente specifica, il che li rende assolutamente inadatti al momento ad interpretare caratteri stampati, compito che – se sia necessario affiancarlo al riconoscimento di quelli a mano – deve essere affidato ad un software OCR.

In secondo luogo, è pressochè necessario adottare della modulistica appositamente progettata, con caselle che facilitino la separazione fra i caratteri digitalizzati così da ridurre gli errori di interpretazione; queste caselle idealmente debbono essere stampate con colorazioni particolari, che possano così essere filtrate ed eliminate dallo scanner in fase di acquisizione così da “ripulire” al massimo l’area di lettura ottica.

Per finire, è molto importante “addestrare” il software ICR su esempi e modelli di scrittura reali e tipici della zona geografica da cui proverranno i documenti da digitalizzare. Un’analisi anche semplice delle modalità di scrittura Europea e Americana, ad esempio, evidenzierà come ci siano molte possibilità di confusione fra diversi caratteri da un modello all’altro, rendendo necessaria la configurazione del software sulla tipologia effettiva di scrittura che dovrà elaborare nella realtà.

Contattateci oggi stesso per chiarimenti, informazioni, o un preventivo gratuito per il vostro nuovo software per la lettura ottica e la digitalizzazione documentale:

Datasis Group Srl - Via delle Piazzole 20 - 22070 Albiolo (CO) - Tel.+39031806519 – Email: info@softwareletturaottica.it – P.Iva 02325530133 - Rea 254748 - C.Soc. € 10.200.