Speciale Tecnologia: le tecniche di image processing e la lettura ottica

La lettura ottica dei documenti è una procedura tecnologicamente complessa ed evoluta, e spesso questo aspetto viene visto solo in quanto legato a concetti come i motori di interpretazione impiegati (OCR, ICR e simili) o le possibilità di indicizzazione automatica che diventa possibile sfruttare. Non bisogna però dimenticare che, di fatto, un documento digitalizzato verrà letto anche da esseri umani, e una parte significativa della tecnologia utilizzata nei software di lettura ottica è proprio diretta a far sì che la versione digitale del documento sia leggibile, chiara e fruibile quanto il cartaceo originale. Iniziamo oggi una serie in due parti sulle tecniche di elaborazione dell’immagine che questi sistemi utilizzano proprio a tale scopo.

Auto-orientamento

Nonostante siamo più abituati a fruire di documenti stampati su fogli di misura A4 messi in verticale, questo non significa in alcun modo che questi siano le uniche dimensioni possibili, o l’unico orientamento logico: molte schede prodotto, così come grafici e tabelle, sono concepite per essere viste su un foglio orientato in orizzontale. Oltre a questo, in una risma di fogli caricati per la scansione può benissimo capitare che qualcuno finisca rovesciato a testa in giù.  Poiché ovviamente l’alimentatore dello scanner che effettua l’acquisizione non può ruotare i fogli, le scansioni di documenti includeranno inevitabilmente alcune pagine orientate in maniera errata rispetto alla lettura corretta, ruotate di 90°, 180° o 270°. Un’apposita funzione di auto-orientamento in un sistema moderno di lettura ottica provvede perciò a determinare il corretto orientamento del foglio scansito e ruotare di conseguenza l’immagine, così da presentare al lettore un documento a schermo che non richiede altre manipolazioni.

Rimozione del bordo nero (Black Border Removal)

Gli scanner professionali ad altissima produttività usano uno sfondo nero durante la scansione: questo permette sia di gestire documenti di diverse misure che di effettuare la lettura di fogli ad alta trasparenza per via del ridotto spessore. Questo significa però che molti documenti, nella versione digitale, presentano un largo bordo nero intorno all’immagine del foglio originale. I moderni software di lettura ottica provvedono quindi a ritagliare il documento, eliminando tali parti annerite, per restituirne un’immagine ordinata e pulita.

Raddrizzamento o Deskew

L’acquisizione dei documenti negli scanner professionali, soprattutto per grandi volumi, non può certo essere effettuata caricando a mano ogni singolo foglio, o si perderebbero i vantaggi di tempo permessi dallo sfruttamento della lettura ottica: si usano invece degli alimentatori automatici di fogli. Questi però, inevitabilmente, tendono a far inclinare leggermente da una parte i documenti sul piano dello scanner; nonostante tale inclinazione raramente superi il paio di gradi, è sgradevole all’occhio e rende faticosa la lettura. I sistemi di raddrizzamento automatico della scansione valutano l’immagine acquisita, ne calcolano il grado di inclinazione, e la ruotano, riportandola alla verticalità originale.

Eliminazione punti scuri (Despeckle)

L’acquisizione ottica dei documenti è una procedura che viene effettuata con dispositivi e componenti molto sofisticati, e quindi delicati. Talora sui sensori che effettuano la scansione si depositano microparticelle di polvere, che sulla scansione definitiva risultano visibili come piccoli punti anneriti (“speck”, in inglese); questo tipo di difetto può addirittura dipendere non da un problema fisico come appunto la polvere, ma perfino da un’interferenza elettrostatica sui sensori stessi. Anche questi punti possono essere rimossi in modalità completamente automatica, e il livello di raffinatezza del sistema di pulizia è tale da saper distinguere questo genere di punti anneriti da rimuovere da altri segni che non vanno eliminati, come virgole, accenti e puntini sulle lettere I.

Eliminazione colore o Color dropping

Nei casi, rari ma presenti, nei quali è necessario effettuare un’acquisizione a colori di un determinato documento per conservarne una versione di assoluta fedeltà al cartaceo, spesso si richiede allo stesso tempo di acquisirne anche una versione monocromatica per estrarne più facilmente i dati. Un esempio classico è quello dei moduli per l’acquisizione ICR, nei quali le caselle vengono stampate in rosso per poter essere facilmente escluse digitalmente dalla scansione facilitando l’identificazione dei caratteri manoscritti in stampatello. L’eliminazione colore è la tecnologia che permette di escludere da un’immagine digitalizza un determinato colore, per arrivare alla versione monocromatica.

Thresholding dinamico

Nella grande maggioranza dei casi, per gli scopi della digitalizzazione e della gestione dei documenti acquisiti, il fatto che un documento originale sia a colori non ha rilevanza, e la scansione viene quindi effettuata – anche per avere file di dimensioni più ridotte – in modalità monocromatica, ossia in bianco e nero. Questo tuttavia presenta una complicazione: se infatti l’acquisizione in scala di grigi non è problematica – ogni colore viene tradotto come una sfumatura di grigio proporzionale alla sua riflessione della luce – il passaggio al monocromatico, dove ogni pixel del documento può essere solo o bianco o nero, e quindi richiede di stabilire una soglia per la quale tutti i punti più luminosi siano considerati bianchi, e quelli più scuri, neri.

Un errore nell’impostazione di questa soglia è però difficilmente evitabile (nessun documento ha un valore di soglia che lo rende perfettamente leggibile in ogni suo punto) ed estremamente problematico, perché può portare a documenti digitali quasi completamente bianchi o troppo scuri, e in entrambi i casi difficilmente leggibili o addirittura indecifrabili. Nel momento in cui questa copia digitale dovesse rimanere l’unica disponibile, dopo la distruzione del cartaceo, questo potrebbe avere conseguenze anche gravi.

Il processo di cosiddetto Thresholding (ossia impostazione della soglia) dinamico è uno dei più evoluti, e consiste nel calcolo automatico, punto per punto, di quale soglia impostare per preservare la leggibilità di tutto il contenuto.

Ricampionamento

Oltre alla presenza del colore, un altro fattore che spesso determina in maniera considerevole le dimensioni di un file è la risoluzione a cui è stato scansito l’originale cartaceo. Se infatti per una copia da conservare in archivio con la massima fedeltà si può desiderare una scansione ad alta risoluzione, che preservi integralmente la qualità originale del documento, per gli usi quotidiani può essere più consigliabile disporre di una versione del file più leggera, anche a prezzo di qualche compromesso sulla qualità grafica. Gli strumenti di lettura e acquisizione dei documenti più moderni sono in grado di effettuare il ricampionamento, ossia il passaggio ad una diversa risoluzione, di documenti già acquisiti, senza bisogno di procedere ad una nuova scansione, eventualmente combinando tale operazione con quella di Thresholding dinamico.

Compressione

Fra le più utili tecnologie di elaborazione immagini ci sono infine i processi di compressione, che permettono la riduzione del peso dei file. I sistemi moderni di lettura ottica sono in grado di analizzare la natura e il contenuto di ogni documento e determinare se, ad esempio, contenga foto che valga la pena digitalizzare a colori, o addirittura procedere ad una scomposizione del documento nei suoi elementi, alla compressione separata di ciascuno con l’algoritmo più appropriato, e al riassemblaggio dei layer così trattati in un file molto più leggero ma senza alcuna perdita di qualità grafica e visiva per l’utente.

Contattateci oggi stesso per chiarimenti, informazioni, o un preventivo gratuito per il vostro nuovo software per la lettura ottica e la digitalizzazione documentale:

Datasis Group Srl - Via delle Piazzole 20 - 22070 Albiolo (CO) - Tel.+39031806519 – Email: info@softwareletturaottica.it – P.Iva 02325530133 - Rea 254748 - C.Soc. € 10.200.