Introducción
Un documento pdf puede ser básicamente de dos tipos:
Archivo de sólo imagen. Se trata del archivo generado mediante el escaneado de un documento. Aunque tenga la extensión pdf, se trata de una fotografía o mapa de bits. En este tipo de documentos es imposible extraer información en texto.
Documento. Documento generado mediante exportación a pdf desde word, excel o cualquier otro software de edición. Este documento contiene una capa con la imagen y otra con el texto incluido en dicha imagen.
Adminet puede realizar el análisis automático de facturas, únicamente desde archivos pdf de tipo documento. Los que sean archivo de sólo imagen deberán ser identificados manualmente por el usuario.
Proceso
Cuando una factura es guardada en la carpeta Facturas a identificar, queda asociada al industrial que la remitió, ya sea por identificación automática del correo del remitente o por indicación manual del usuario.
El proceso de análisis automático de facturas de adminet toma cada factura recibida y la contrasta con las plantillas de facturas pdf de ese industrial, por orden de creación, hasta que encuentra una con la que puede identificar todos sus valores sin ningún error. Los valores asociados son guardados en la carpeta Facturas a identificar, junto al documento.
imagen de una factura identificada con sus textos
Haga clic aquí para ver cómo configurar una plantilla de factura en pdf.