Extrair Dados de PDF
Transforma PDFs em dados estruturados editáveis. NIF, valores, datas, linhas de artigo — tudo extraído automaticamente.
Porquê extrair dados de PDF
A maioria das faturas e documentos empresariais chegam em formato PDF. Muitos destes PDFs são "imagens" — o texto não é seleccionável. Mesmo nos PDFs com texto nativo, os dados não são estruturados: para importar um NIF, uma data ou um valor no ERP, é preciso copiar campo a campo.
O PhotonDoq resolve ambos os problemas: extrai dados de PDFs nativos e de PDFs com imagem (scan), e estrutura-os em campos prontos para exportação.
Tipos de PDF suportados
- PDF nativo (texto seleccionável): extracção directa dos campos com IA. O mais rápido e preciso.
- PDF scan (imagem): OCR converte a imagem em texto, depois a IA extrai os campos. Funciona com qualquer resolução razoável (150+ DPI).
- PDF misto: documentos com texto nativo e imagens incorporadas. A IA processa cada zona adequadamente.
- PDF protegido: PDFs com restrições de edição são processados normalmente (a extracção não edita o original).
O que é extraído
Dependendo do tipo de documento, o PhotonDoq extrai:
- Faturas: NIF emitente/destinatário, data, número, base tributável, IVA, total, linhas de detalhe
- Extractos bancários: movimentos, datas de valor, descrições, saldos, IBAN
- Contratos: partes, datas, valores, cláusulas-chave
- Certidões: dados de registo, datas, referências
Exportação de dados
Os dados extraídos podem ser exportados em 14 formatos:
- ERPs portugueses: TOConline (API + XLSX), PHC GO, Primavera V10, Odoo
- Standard: Excel (XLSX), CSV, JSON
- Fiscal: SAF-T (PT) compatível
Perguntas frequentes
Funciona com PDFs digitalizados?+
Sim. O OCR com IA lê texto de PDFs com imagem (scans) com mais de 95% de precisão. Recomendamos 200+ DPI para melhores resultados.
O PDF original é alterado?+
Não. O PhotonDoq lê o PDF e extrai dados — o ficheiro original não é modificado.
Posso processar PDFs em lote?+
Sim. Podes carregar múltiplos PDFs de uma vez. Cada um é processado individualmente e os dados ficam disponíveis para exportação em lote.