source: ocr-su-scansioni-qualita-revisione.md
category: dataQuality
published: 5 de agosto de 2025
read_time: 11m
OCR en escaneos: DPI, inclinación y la cola de revisión
Los escaneos imponen restricciones distintas a los PDF digitales. Calidad de imagen, sellos, skew: cómo configurar el flujo y cuándo hace falta revisión humana.
No todos los PDF son iguales. Una factura recibida por correo como archivo nativo se comporta distinto del mismo documento impreso, firmado, sellado y escaneado en oficina. Para estos últimos el OCR es la única vía — y la calidad de imagen determina gran parte del resultado, independientemente de cuán «inteligente» sea el motor posterior.
Resolución y DPI: el mínimo operativo
Para texto administrativo estándar, 300 dpi es un buen mínimo. Por debajo, caracteres pequeños (notas al pie, códigos artículo) se vuelven ambiguos. Por encima, la ganancia marginal hay que pesarla con tiempos de subida y almacenamiento. En fotos de móvil, revisad enfoque e iluminación: una imagen borrosa no se recupera a 600 dpi.
- Preferid escaneo en blanco y negro o escala de grises para texto — el color rara vez ayuda al OCR
- Evitad compresión agresiva: artefactos JPEG se confunden con trazos de bolígrafo
- Multipágina: una página torcida en un albarán largo puede corromper toda la tabla
Skew, sellos y «ruido» visual
Documentos ligeramente rotados castigan las tablas: las columnas no alinean y el OCR mezcla celdas. Sellos y firmas sobre importes o NIF son el caso clásico de revisión — ningún motor debería forzar un número cubierto al 40%. Pliegues, manchas y fax de baja calidad entran aquí: mejor señalar incertidumbre que inventar cifras.
Un OCR que no admite duda en campos inciertos es más peligroso que uno que pide una segunda mirada.
La cola de revisión humana
En un flujo maduro, la revisión no es respaldo de fallo total: es filtro dirigido. El sistema marca campos de baja confianza, totales no conciliados, códigos anómalos. El operador ve documento y valores lado a lado, corrige solo la excepción, el resto pasa. El tiempo humano escala con el porcentaje de documentos «sucios», no con el volumen total.
Métricas útiles — sin números de marketing
- Porcentaje de documentos en revisión por tipo (factura vs albarán vs pedido)
- Tiempo medio de revisión por excepción — no solo «minutos ahorrados»
- Campos correctos al primer pase en digitales vs escaneos — dos curvas distintas
- Errores detectados aguas abajo (contabilidad, almacén) tras la extracción
Prevenir aguas arriba
Estandarizar cómo se escanea en oficina — misma resolución, mismo formato, evitar «foto del documento en la mesa» — reduce la cola más que cualquier ajuste del motor. Donde sea posible, pedid a proveedores el PDF nativo: es gratis en términos de calidad.
LOCRAI trata escaneos y PDF digitales con rutas distintas y destaca campos a verificar, para que la calidad del dato siga bajo control aunque el documento origen no lo esté.
¿Quieres verlo sobre tus documentos?
Te mostramos LOCRAI trabajando sobre uno de tus flujos reales, en una demo breve y concreta.
Solicita una demoSigue leyendo
source: quanto-costa-data-entry-manuale.md
category: automation
published: 25 de junio de 2026
read_time: 11m
Entrada manual de datos: cómo medir el coste real del flujo documental
source: automazione-ciclo-passivo.md
category: automation
published: 24 de junio de 2026
read_time: 12m
Automatización del ciclo de compras: de la factura al ERP sin data entry
