source: dmv-vs-ocr.md
category: underTheHood
published: 18 giugno 2026
read_time: 13m
OCR, text layer, analisi visiva: cosa legge davvero un documento
Una guida senza fronzoli ai diversi modi di leggere un documento e a quando conviene ciascuno.
Quando carichi un documento dai per scontato che venga «letto». Ma leggere un PDF non è un'operazione sola: a seconda di com'è fatto il file, ci sono modi molto diversi di tirarne fuori il testo. Capirli aiuta a capire perché alcuni documenti si elaborano in un lampo e altri richiedono qualche secondo in più — e perché alcuni vendor promettono «AI ovunque» quando spesso basterebbe molto meno.
Il documento già strutturato
Il caso migliore in assoluto. Alcuni documenti — su tutti la fattura elettronica — sono già dati: dietro l'apparenza grafica c'è un file con i campi etichettati uno per uno. Qui non serve «leggere» nulla, basta interpretare la struttura. È preciso al 100% e non richiede alcuna analisi avanzata.
Anche molti PDF «nativi digitali» generati da gestionali hanno metadati o strutture ripetibili. Un buon motore riconosce questi pattern e non spreca OCR dove non serve.
Il text layer nativo
Molti PDF nascono digitali: il testo è già dentro il file, selezionabile e copiabile. In questi casi non serve «guardare» l'immagine, basta estrarre il testo che c'è già. Veloce, affidabile, economico. Il problema è quando questo strato manca o è incompleto.
Attenzione al falso amico: a volte il text layer c'è ma è disordinato — il totale in fondo al file appare prima dell'intestazione nel flusso di estrazione. Qui serve intelligenza sul layout, non solo copia del testo grezzo.
L'OCR sui documenti scansionati
Una fattura stampata e poi scansionata, o una ricevuta fotografata, è solo un'immagine: di testo «vero» non ce n'è. Qui entra l'OCR, che riconosce i caratteri a partire dai pixel. Funziona bene, ma è sensibile alla qualità della scansione: storto, sbiadito o a bassa risoluzione complicano la vita.
- 300 dpi è un buon minimo per testo piccolo
- Le tabelle strette puniscono le scansioni storte
- Timbri e firme sopra i numeri sono il caso classico da revisione
L'analisi visiva con l'AI, come ultima risorsa
Quando il layout è complesso o la scansione è davvero difficile, serve un livello in più: l'AI guarda il documento nel suo insieme, capisce dove sta cosa, interpreta tabelle e blocchi. È l'arma più potente, ma anche la più costosa — per questo ha senso usarla solo quando gli altri metodi non bastano.
Modelli multimodali eccellono su documenti «sporchi» o mai visti. Ma usarli su ogni fattura elettronica strutturata sarebbe come usare un jet per andare al bar: veloce, sì, ma il costo non ha senso.
La cascata «deterministico prima»
La logica migliore è una cascata: prova struttura, poi text layer, poi OCR, poi analisi visiva. Ogni documento prende la strada più breve che lo porta a un risultato corretto. Paghi solo lo sforzo necessario, e i tempi medi restano bassi anche con un 10% di scansioni difficili.
La regola è semplice: prova prima il modo più economico e preciso, e sali di livello solo se serve davvero.
Cosa significa per te in pratica
Se il tuo flusso è fatto per lo più di PDF digitali, non serve un motore «solo vision». Se ricevi molti DDT fotografati da magazzino, l'OCR robusto e la revisione mirata contano più della fattura elettronica perfetta. Chiedi sempre: qual è il mix dei miei documenti, e come il sistema sceglie il metodo per ciascuno?
LOCRAI segue questa filosofia: struttura prima, AI quando serve. Meno costo, meno variabilità, più spiegabilità — e risultati che reggono quando il volume sale.
Vuoi vederlo sui tuoi documenti?
Ti mostriamo LOCRAI al lavoro su un tuo flusso reale, in una demo breve e concreta.
Richiedi una demoContinua a leggere
source: quanto-costa-data-entry-manuale.md
category: automation
published: 25 giugno 2026
read_time: 11m
Data entry manuale: come misurare il costo reale del processo documentale
source: automazione-ciclo-passivo.md
category: automation
published: 24 giugno 2026
read_time: 12m
Automazione del ciclo passivo: dalla fattura al gestionale senza data entry
