Dokumente & OCR — Überblick
Posteingangsbasierte Dokumentenerfassung mit KI-Klassifizierung und -Extraktion.
Das Dokumente-Modul ist die einzige Eingangstür für jeden Beleg, der in Ihr Unternehmen gelangt. Es betreibt eine OCR- und KI-Klassifizierungs-Pipeline, sodass PDFs, gescannte Belege und E-Mail-Anhänge mit minimalem Tippaufwand zu strukturierten Datensätzen werden (Lieferantenrechnungen, Spesen, Aufträge, Verträge).
Was es tut
- Erfasst Dokumente aus E-Mail, manuellem Upload oder API.
- Speichert sie verschlüsselt im Ruhezustand (PII-Felder mit separatem Schlüssel).
- OCR + extrahiert den Textinhalt über Mistral Document AI.
- Klassifiziert das Dokument (Lieferantenrechnung, Spese, Vertrag, Lieferschein usw.) mit einem Konfidenzwert.
- Befüllt die passende Entität vor (Rechnung / Spese / Offerte) und wartet auf Ihre Ein-Klick-Bestätigung.
Warum wir nicht automatisch verbuchen
Auch bei hoher Konfidenz wird jede Extraktion von einem Menschen geprüft, bevor sie ins Hauptbuch gelangt. Dies ist eine bewusste Entscheidung für treuhandtaugliche Compliance: Ein einziger falsch erkannter MwSt.-Betrag könnte eine Steuerkorrektur auslösen. Der Prüfschritt ist schnell (10–15 Sekunden pro Dokument), weil alles vorbefüllt ist.
Unterstützte Formate
- PDF (ein- oder mehrseitig)
- PNG, JPG, HEIC (Handyfotos willkommen)
- EML (vollständige E-Mail inklusive HTML-Text und Anhängen)
- TIFF (ältere Scans)
Wie lange es dauert
Die meisten Dokumente werden in 5–30 Sekunden verarbeitet. Komplexe mehrseitige Rechnungen oder zu PDF gescannte (reine Bild-)PDFs können bis zu 2 Minuten dauern. Auf der Dokumentenkarte sehen Sie eine Fortschrittsanzeige.
Wie es weitergeht
- Dokumente hochladen
- Extrahierte Daten prüfen