Come si recuperano automaticamente i dati nei documenti a layout variabile?

L’acquisizione automatica dei dati tramite software di lettura ottica è ormai un fatto acquisito nelle aziende. Ma se la procedura è semplice quando si ha a che vedere sempre con gli stessi tipi di modulo, le cose si fanno molto più complesse quando i documenti da cui estrarre dati sono free-form, e non si conformano quindi a nessuna struttura standard.

Cosa sono i documenti a layout variabile

La definizione di documento free-form, o a layout variabile, significa di per sé semplicemente che il documento in questione non è costruito su un modulo fisso. Una fattura normalmente non è un documento free-form, perché ha dei campi predefiniti e fissati (in base alla modulistica che l’azienda ha scelto di adottare) per i quali per esempio la ragione sociale è sempre in alto a destra, l’indirizzo del cliente in basso a sinistra, e così via. Rappresenta invece un esempio perfetto di documento a layout variabile e non noto una scheda prodotto, nella quale sono presenti diversi blocchi di informazioni ma non c’è modo di prevedere a priori dove si troveranno, nel layout, il nome, le specifiche tecniche, il prezzo e così via.

La difficoltà di estrapolare dati dai documenti free-form

I documenti free-form pongono una sfida non indifferente ai programmi che si occupano di estrapolazione dati tramite lettura ottica.

Nei documenti a modulo fisso, infatti, la programmazione del software può essere complessa, ma è prevedibile. Se anche il software deve gestire, ad esempio, fatture provenienti da tre fornitori differenti, ciascuno col suo modulo, il lavoro si fa solamente più massiccio (perché bisogna prevedere tre diversi modelli documentali differenti per insegnare al programma dove troverà quale dato) ma concettualmente non cambia.

Nel caso di un’estrazione dati da documenti free-form, invece, la questione cambia completamente. Non c’è infatti la possibilità di identificare un’area della pagina, una zona del layout, dove dire al programma che troverà il nome del prodotto, o lo sconto previsto, o il prezzo al dettaglio: questi dati sono sicuramente presenti, come molti altri, e sono anche in mezzo ad altri dati di nessun interesse, ma non è immediato capire come insegnare al programma dove cercarli.

Dalla mappatura spaziale a quella logica

La tecnologia usata nei sistemi per documenti free-form cambia quindi criterio fondante. Nei casi che abbiamo analizzato precedentemente di documenti a modulo fisso, infatti, veniva operata quella che si chiama una mappatura “spaziale”, che dava ossia riferimenti sul punto dove localizzare le informazioni definendo specifiche aree della pagina da scansionare e interpretare.

Nelle applicazioni per lettura ottica dei documenti a layout variabile, invece, viene adottata una mappatura di tipo più evoluto, logica. Il sistema provvede all’interpretazione tramite software OCR di tutto il contenuto del documento, effettuando anche un’analisi della struttura della pagina, e successivamente applica una serie di criteri precedentemente programmati – come il formato in cui il dato dovrebbe trovarsi, la vicinanza ad altri termini chiave come “indirizzo” o “Prezzo”, e simili concetti – per identificare all’interno del documento i dati che devono essere estrapolati. Basandosi su sistemi di intelligenza artificiale, questi software si avvicinano molto alla “lettura” vera e propria di un documento, e dimostrano risultati sempre più interessanti.

Contattateci oggi stesso per chiarimenti, informazioni, o un preventivo gratuito per il vostro nuovo software per la lettura ottica e la digitalizzazione documentale:

Datasis Group Srl - Via delle Piazzole 20 - 22070 Albiolo (CO) - Tel.+39031806519 – Email: info@softwareletturaottica.it – P.Iva 02325530133 - Rea 254748 - C.Soc. € 10.200.