Documents & OCR — aperçu
Capture de documents par inbox avec classification et extraction IA.
Le module Documents est l'entrée unique pour tout document qui arrive chez vous. Il fait tourner un pipeline OCR + classification IA pour que PDF, tickets scannés et pièces jointes deviennent des enregistrements structurés (factures, notes de frais, devis, contrats) avec un minimum de saisie humaine.
Ce qu'il fait
- Ingestion des documents par email, upload manuel ou API.
- Stockage chiffré au repos (les champs PII avec une clé séparée).
- OCR + extraction du contenu textuel via Mistral Document AI.
- Classification du document (facture fournisseur, note de frais, contrat, bon de livraison, etc.) avec un score de confiance.
- Pré-remplissage de l'entité correspondante (facture / note de frais / devis) en attente de votre validation en un clic.
Pourquoi pas de publication automatique
Même avec une confiance élevée, chaque extraction est revue par un humain avant passage au grand livre. C'est un choix design délibéré pour la conformité fiduciary-grade : un seul montant TVA mal OCR'isé peut déclencher une rectification fiscale. L'étape de revue est rapide (10-15 secondes par document) parce que tout est pré-rempli.
Formats supportés
- PDF (mono ou multi-pages)
- PNG, JPG, HEIC (photos mobile bienvenues)
- EML (email complet avec corps HTML et pièces jointes)
- TIFF (scans legacy)
Temps de traitement
La plupart des documents sont traités en 5 à 30 secondes. Les factures multi-pages complexes ou les PDF image-only (scannés-vers-PDF) peuvent prendre jusqu'à 2 minutes. Vous voyez un indicateur de progression sur la carte du document.
Pour aller plus loin
- Uploader des documents
- Valider les données extraites