Docs
ProduktDokumenten-OCR

Dokumente & OCR — Überblick

Posteingangsbasierte Dokumentenerfassung mit KI-Klassifizierung und -Extraktion.

Das Dokumente-Modul ist die einzige Eingangstür für jeden Beleg, der in Ihr Unternehmen gelangt. Es betreibt eine OCR- und KI-Klassifizierungs-Pipeline, sodass PDFs, gescannte Belege und E-Mail-Anhänge mit minimalem Tippaufwand zu strukturierten Datensätzen werden (Lieferantenrechnungen, Spesen, Aufträge, Verträge).

Was es tut

  1. Erfasst Dokumente aus E-Mail, manuellem Upload oder API.
  2. Speichert sie verschlüsselt im Ruhezustand (PII-Felder mit separatem Schlüssel).
  3. OCR + extrahiert den Textinhalt über Mistral Document AI.
  4. Klassifiziert das Dokument (Lieferantenrechnung, Spese, Vertrag, Lieferschein usw.) mit einem Konfidenzwert.
  5. Befüllt die passende Entität vor (Rechnung / Spese / Offerte) und wartet auf Ihre Ein-Klick-Bestätigung.

Warum wir nicht automatisch verbuchen

Auch bei hoher Konfidenz wird jede Extraktion von einem Menschen geprüft, bevor sie ins Hauptbuch gelangt. Dies ist eine bewusste Entscheidung für treuhandtaugliche Compliance: Ein einziger falsch erkannter MwSt.-Betrag könnte eine Steuerkorrektur auslösen. Der Prüfschritt ist schnell (10–15 Sekunden pro Dokument), weil alles vorbefüllt ist.

Unterstützte Formate

  • PDF (ein- oder mehrseitig)
  • PNG, JPG, HEIC (Handyfotos willkommen)
  • EML (vollständige E-Mail inklusive HTML-Text und Anhängen)
  • TIFF (ältere Scans)

Wie lange es dauert

Die meisten Dokumente werden in 5–30 Sekunden verarbeitet. Komplexe mehrseitige Rechnungen oder zu PDF gescannte (reine Bild-)PDFs können bis zu 2 Minuten dauern. Auf der Dokumentenkarte sehen Sie eine Fortschrittsanzeige.

Wie es weitergeht

  • Dokumente hochladen
  • Extrahierte Daten prüfen