Strumenti per la classificazione automatica dei documenti in azienda

Fra gli scopi applicativi più utili ed interessanti della lettura ottica dei documenti c’è la possibilità di sfruttare i dati risultanti dalla scansione per effettuare una indicizzazione automatica dell’intero flusso documentale dell’azienda, in entrata e in uscita. Questo processo, combinato a procedure di analisi automatizzata dei documenti, può anche essere sfruttato per classificarli in categorie specifiche.

L’utilità della classificazione dei documenti aziendali

Le ragioni per cui un’azienda può desiderare di analizzare il flusso documentale in entrata sono molte, ma una delle più frequenti è quella di smistare i vari tipi di documento agli uffici e ai responsabili che dovevano occuparsene, soprattutto nel caso in cui le priorità siano diverse a seconda del tipo di documento. Se immaginiamo infatti un’azienda moderna, nella quale il cartaceo ricevuto viene immediatamente digitalizzato e i fax in arrivo vengono convertiti anch’essi in formato digitale per essere poi assimilati alle e-mail in entrata, notiamo come il massiccio flusso documentale che ne risulta diventi indistinto, e sia impossibile risalire facilmente a come gestire ogni comunicazione senza richiedere un intervento manuale – e quindi lungo e dispendioso – da parte di risorse umane meglio impiegabili altrove. Classificare i documenti, in questo caso, significa semplicemente fare in modo che il sistema di gestione documentale sappia riconoscere la tipologia di ciascuna documentazione e decida di conseguenza come trattarla.

Le possibilità tecnologiche offerte dalla lettura ottica per l’indicizzazione dei documenti in azienda

Per ottenere un risultato del genere appena descritto è necessario mettere in gioco diverse tecnologie, così da poter coprire l’identificazione dell’intera gamma di possibili documenti in entrata.

Per quanto riguarda i documenti a struttura fissa, ad esempio, la metodologia più efficiente prevede di utilizzare degli algoritmi di identificazione del modulo stesso, grazie ai quali il software può comparare la scansione con i parametri che sono parte del suo programma (loghi, fincature, struttura grafica) e riconoscere i moduli che già conosce. L’apprendimento da parte del sistema di tali parametri si ottiene solitamente con una fase di “addestramento” in cui al software vengono fatti analizzare i moduli campione che dovrà poi saper riconoscere.

Vi sono però moltissimi tipi di documentazione che non hanno una struttura a modulo fisso, bensì sono identificabili come documenti a layout variabile. In questi casi le procedure di form identification appena descritte si rivelerebbero completamente inefficaci, ed è necessario procedere con una tecnologia più evoluta di analisi. Tramite un motore di riconoscimento caratteri (solitamente un OCR per i caratteri stampati)  viene estratto l’intero contenuto del documento, all’interno del quale il sistema effettua poi una ricerca di specifiche keyword per decidere che tipo di documento sia e cosa debba farne. Queste keyword possono essere sia programmate dall’operatore umano responsabile del sistema, sia lasciate “apprendere” al sistema sottoponendogli in fase di addestramento un gran numero di documenti delle varie categorie.

Fra le applicazioni di questa tecnologia spicca anche, per inciso, la possibilità di verificare il corretto ordinamento dei fogli nei documenti multipagina.

I vantaggi di un archivio aziendale con classificazione automatica

Una volta implementato e opportunamente addestrato, come abbiamo visto, un sistema di classificazione automatica è in grado quindi di profilare ogni documento scansito in maniera completamente automatica e nel giro di pochi secondi, senza più alcuna necessità di intervento umano; in effetti, il software così configurato può provvedere anche, dopo la scansione, a tutte quelle procedure di miglioramento grafico e image processing necessarie a garantire un’ottimale leggibilità dei documenti acquisiti, per poi appunto effettuarne lo smistamento in base ai criteri stabiliti. Oltre a questo risparmio diretto di tempo il sistema potrà poi provvedere, contestualmente, all’estrazione e identificazione delle chiavi di ricerca necessarie alla classificazione del documento per l’inserimento in un archivio digitale, anche qui liberando l’azienda dalla necessità di deputare uno specifico collaboratore alle lunghe e monotone procedure di data entry che si renderebbero normalmente necessarie per un risultato simile.

Contattateci oggi stesso per chiarimenti, informazioni, o un preventivo gratuito per il vostro nuovo software per la lettura ottica e la digitalizzazione documentale:

Datasis Group Srl - Via delle Piazzole 20 - 22070 Albiolo (CO) - Tel.+39031806519 – Email: info@softwareletturaottica.it – P.Iva 02325530133 - Rea 254748 - C.Soc. € 10.200.