Intelligente Dokumentenverarbeitung (IDP) bezeichnet KI-gestützte Software, die Daten aus Geschäftsdokumenten automatisch ausliest, klassifiziert und prüft. Klassische OCR erkennt nur Text, RPA folgt starren Regeln. Ein IDP-System versteht den Kontext eines Dokuments und wird durch Korrekturen genauer.
Dieser Leitfaden richtet sich an Verantwortliche in IT, Operations und Digitalisierung, die eine IDP-Plattform evaluieren oder einen Business Case dafür aufbauen.
IDP ist kein einzelnes Produkt, sondern eine Architektur aus mehreren KI-Bausteinen: OCR, Natural Language Processing, maschinelles Lernen und Computer Vision. Sie wandelt Dokumente in strukturierte Daten um, die weiterverarbeitet werden können.
Ein IDP-System beantwortet die Frage "Was steht in diesem Dokument?" und zusätzlich "Was bedeutet das?" und "Ist der Inhalt plausibel?".
Die Verarbeitung eines Dokuments läuft in sieben Phasen ab: Erfassung über Scanner, E-Mail-Postfächer, Upload-Portale oder API; Vorverarbeitung mit Bildverbesserung und Entzerrung; Klassifizierung des Dokumenttyps; Extraktion der Felder; Validierung gegen Geschäftsregeln und Stammdaten; Integration in ERP, DMS oder Buchhaltungssoftware; und Lernen aus manuellen Korrekturen, die als Trainingssignal in die Modelle zurückfließen.
Der Unterschied zu einfacheren Automatisierungsansätzen liegt im Umgang mit Varianz. Ein Unternehmen, das Rechnungen von 500 Lieferanten in 12 Layouts verarbeitet, bekommt diese Varianz mit regelbasierter Technik nicht wirtschaftlich in den Griff.
In der Praxis werden die Begriffe OCR, RPA und IDP oft durcheinandergebracht. Für eine Technologieentscheidung lohnt sich eine klare Abgrenzung.
| Kriterium | Klassische OCR | RPA | IDP |
|---|---|---|---|
| Verarbeitungslogik | Regelbasiert, templategesteuert | Regelbasiert, skriptgesteuert | KI-gestützt, kontextsensitiv |
| Umgang mit Dokumentvarianz | Gering | Sehr gering | Hoch; lernt aus Beispielen |
| Unstrukturierte Daten | Nicht verarbeitbar | Nicht verarbeitbar | Verarbeitbar |
| Lernfähigkeit | Keine | Keine | Kontinuierlich durch Human-in-the-Loop |
| Semantisches Verständnis | Keines | Keines | Vorhanden durch NLP |
| Typischer Einsatzbereich | Gleichförmige Dokumente | Strukturierte digitale Workflows | Variable, dokumentenintensive Prozesse |
Die Klassifizierung ordnet eingehende Dokumente automatisch einem Dokumenttyp zu. Gute Klassifizierungsmodelle nutzen sowohl das visuelle Layout als auch den Text. In Produktionsumgebungen liegt die angestrebte Genauigkeit bei 95 Prozent oder höher.
Moderne Extraktionsmodelle nutzen Large Language Models und kombinieren positionsbasierte, ankerbasierte und kontextbasierte Methoden. Wer mit internationalen Lieferanten arbeitet, sollte auf mehrsprachige Extraktion achten. Führende IDP-Plattformen unterstützen zwischen 20 und über 100 Sprachen.
Die Validierungsschicht prüft drei Dinge: ob die Werte intern konsistent sind (z.B. Summe der Positionen = Gesamtbetrag), ob sie fachlich plausibel sind und ob sie zu externen Referenzdaten passen. Dieser dreistufige Check senkt die Fehlerquote deutlich.
Das Human-in-the-Loop-Prinzip ist der Kern, der IDP von statischer Automatisierung abhebt. In der Praxis steigern Unternehmen ihre Straight-Through-Processing-Rate von anfangs 60 bis 70 Prozent auf 85 bis 95 Prozent in den ersten 6 bis 12 Monaten.
Das ist der mit Abstand häufigste Anwendungsfall. Unternehmen ab etwa 50 Mitarbeitern verarbeiten zwischen 500 und 50.000 Eingangsrechnungen pro Monat, oft in sehr unterschiedlichen Formaten. Typisches Ergebnis nach IDP-Einführung: Die Durchlaufzeit sinkt von durchschnittlich 8 Tagen auf unter 24 Stunden, die Fehlerquote von 2 bis 4 Prozent auf unter 0,5 Prozent.
IDP-Systeme lesen Vertragsparteien, Laufzeiten, Kündigungsfristen und Haftungsklauseln aus. Auch Preisindexierungsklauseln lassen sich extrahieren, was bei Lieferantenverträgen für die Budgetplanung relevant ist.
IDP beschleunigt die Erstzuweisung und die Dateneingabe deutlich. Eine risikobasierte Triage wird möglich, weil das System Schadenshöhe, Schadensart und Vorgeschichte direkt aus dem Dokument zieht.
Lieferscheine, Frachtbriefe (CMR, AWB, BL), Zolldeklarationen und Gefahrgutdokumente folgen teils standardisierten, teils länderspezifischen Formaten. Für Speditionen und Importeure mit hohem Volumen lohnt sich die Automatisierung schnell.
In HR-Abteilungen dominieren Bewerbungsunterlagen, Arbeitsverträge, Zeugnisse, Gehaltsabrechnungen und Krankmeldungen. IDP übernimmt die Datenerfassung in das HR-System und macht die Inhalte durchsuchbar.
Lido ist eine IDP-Plattform für Finanz-, Operations- und Shared-Service-Teams in mittelständischen und großen Unternehmen. Sie kombiniert vortrainierte Modelle für gängige Dokumenttypen mit einem Studio, in dem sich eigene Dokumenttypen ohne Data-Science-Kenntnisse konfigurieren lassen. Lido ist stark bei tabellarischer Datenextraktion und bei europäischen Sprachen, und integriert direkt mit den ERP- und Buchhaltungssystemen, die im deutschen Mittelstand üblich sind. Daten werden DSGVO-konform in deutschen Rechenzentren gehalten, was für regulierte Branchen relevant ist.
ABBYY gibt es seit den 1990er Jahren und ist damit einer der Veteranen im Markt. Vantage ist die Cloud-Plattform für Großunternehmen mit vielen Dokumenttypen. Die OCR-Engine gilt branchenweit als Referenz.
UiPath Document Understanding ist das IDP-Modul innerhalb der UiPath-RPA-Plattform. Sinnvoll vor allem für Unternehmen, die bereits UiPath für Prozessautomatisierung nutzen.
Hyperscience richtet sich an Enterprise-Kunden und ist stark bei Handschrifterkennung und strukturierten Formularen.
Rossum ist eine auf Rechnungsverarbeitung spezialisierte IDP-Plattform aus Europa, mit entsprechend ausgebauter DSGVO-Compliance.
Nanonets ist ein cloudbasierter IDP-Dienst mit Self-Service-Ansatz. Die API-first-Architektur macht die Integration in eigene Anwendungen einfacher.
Azure AI Document Intelligence ist ein KI-Service innerhalb der Microsoft-Azure-Plattform. Wer ohnehin stark im Microsoft-Ökosystem unterwegs ist, profitiert von der Integration mit Power Automate, Dynamics 365 und SharePoint.
Google Document AI bietet universelle und spezialisierte Parser für Branchen wie Banken und Versicherungen.
| Anbieter | Kernstärke | DSGVO/On-Premise | ERP-Integration (DE) |
|---|---|---|---|
| Lido | Tabellenextraktion, europ. Sprachen | DSGVO-konform; Cloud DE + On-Premise | SAP, Dynamics, DATEV, Diamant |
| ABBYY Vantage | OCR-Qualität, Skill-Bibliothek | DSGVO-konform; Cloud + On-Premise | Umfangreich über Partner |
| UiPath Document Understanding | RPA-Integration | DSGVO-konform | Über UiPath-Integrationen |
| Hyperscience | Handschrift, Formulare | DSGVO-konform | Begrenzt in DE |
| Rossum | Rechnungsverarbeitung | DSGVO-konform; Cloud EU | SAP, Dynamics |
| Nanonets | API-first | DSGVO-konform; Cloud | Über API |
| Azure AI Document Intelligence | Microsoft-Ökosystem | DSGVO-konform; Azure EU | Dynamics, Power Platform |
| Google Document AI | Branchenspezifische Parser | DSGVO prüfungsbedürftig | Über API |
Ein erfahrener Sachbearbeiter braucht für eine Eingangsrechnung manuell 3 bis 7 Minuten. Ein IDP-System schafft dieselbe Rechnung in 5 bis 30 Sekunden. Bei 5.000 Rechnungen pro Monat sind das 250 bis 580 Arbeitsstunden Entlastung im Monat.
Studien zur manuellen Dateneingabe zeigen Fehlerquoten zwischen 1 und 4 Prozent pro Feld. Ein IDP-System mit kalibrierter Validierung und Human-in-the-Loop kommt auf unter 0,5 Prozent. Bei 15 bis 25 Euro Schadenswert pro Fehler und 10.000 Dokumenten im Monat summieren sich die Fehlerkosten ohne IDP auf 15.000 bis 100.000 Euro monatlich.
Die Straight-Through-Processing-Rate (STP-Rate) ist die wichtigste Steuerungsgröße. Im Projektanlauf liegt sie bei 55 bis 70 Prozent, nach 4 bis 6 Monaten bei 75 bis 85 Prozent, im Reifebetrieb ab Monat 12 zwischen 88 und 95 Prozent.
Ein mittelständisches Unternehmen mit 3.000 bis 8.000 Rechnungen pro Monat zahlt jährlich 24.000 bis 80.000 Euro Lizenzkosten, plus 10.000 bis 40.000 Euro einmalige Implementierungskosten. Demgegenüber stehen jährliche Einsparungen von 60.000 bis 200.000 Euro. Die Amortisation liegt bei 6 bis 18 Monaten.
Prüfen Sie bei jedem Anbieter die native Konnektivität zu Ihren Kernsystemen: SAP, Microsoft Dynamics, DATEV, Buchhaltungssysteme wie Diamant oder Lexware und Ihr DMS. Eine fehlende Standard-Integration heißt fast immer Custom-Entwicklung und damit höhere Folgekosten.
Klären Sie mit jedem Anbieter vier Punkte: Wo werden die Daten gespeichert? Werden Dokumentdaten für das Training globaler Modelle genutzt? Wie lange werden Dokumente vorgehalten? Liegt ein Auftragsverarbeitungsvertrag vor?
IDP-Systeme müssen Lastspitzen verkraften, etwa zum Monatsende, wenn besonders viele Rechnungen eingehen. Klären Sie die SLA-Anforderungen und prüfen Sie, ob der Anbieter automatisches horizontales Skalieren unterstützt.
Sachbearbeiter, die bisher manuell Daten eingegeben haben, bekommen eine neue Aufgabe. Sie validieren und korrigieren KI-Ausgaben, statt Felder von Grund auf einzutippen. Das ist eine andere Tätigkeit, die andere Schulung braucht und im ersten Quartal oft Reibung erzeugt.
Ja, wenn das Dokumentenvolumen reicht. Als Faustregel: Ab etwa 500 Dokumenten pro Monat in einem einheitlichen Prozess rechnet sich ein Business Case. Cloud-Plattformen mit volumenbasiertem Pricing haben die Einstiegshürde für KMU deutlich gesenkt.
Eine erste Implementierung für einen Dokumenttyp dauert 6 bis 16 Wochen. Breiter angelegte Rollouts über mehrere Dokumenttypen und Abteilungen dauern 6 bis 18 Monate. Anbieter mit vortrainierten Modellen verkürzen die initiale Trainingsphase deutlich.
DSGVO-Konformität bedeutet vier Dinge: Datenhaltung in EU-Rechenzentren mit Auftragsverarbeitungsvertrag, automatische Löschung nach definierten Aufbewahrungsfristen, Ausschluss der Nutzung von Kundendokumenten für plattformübergreifendes Modelltraining und granulare Zugriffsrechte.
Ja. Lido, ABBYY und UiPath bieten On-Premise-Deployments an. Diese Installationen sind in der Regel containerbasiert und setzen geeignete Serverinfrastruktur voraus.
Die Lernfähigkeit hängt von der Qualität der manuellen Korrekturen, der Häufigkeit seltener Dokumentvarianten und dem Retraining-Zyklus des Anbieters ab. In produktiven Implementierungen steigt die STP-Rate von 55-70 Prozent beim Start auf 88-95 Prozent nach 12 Monaten.
Für SAP stehen RFC-Konnektoren, IDoc-Interfaces oder REST-APIs zur Verfügung. Für DATEV bietet Lido eine Integration über die DATEV-Belegtransfer-Schnittstelle. Andere Anbieter brauchen für DATEV oft Middleware oder Custom-Entwicklung.