Rechnungserkennung bezeichnet den automatisierten Prozess, bei dem Software buchhalterisch relevante Felder aus eingehenden Rechnungen extrahiert und strukturiert bereitstellt. Moderne Lösungen kombinieren optische Zeichenerkennung mit KI-basierter Feldzuordnung, um Rechnungsnummer, Lieferantendaten, Steuerbeträge und Positionszeilen ohne manuelle Eingabe zu liefern.
Rechnungserkennung ist ein Teilbereich der intelligenten Dokumentenverarbeitung (IDP), der speziell auf eingehende Geschäftsbelege ausgerichtet ist. Im Unterschied zu generischer OCR-Software, die rohen Text aus Bilddateien extrahiert, ordnet eine Rechnungserkennungslösung die erkannten Textelemente konkreten Belegfeldern zu.
Der wesentliche Unterschied liegt in der semantischen Interpretation. Ein OCR-System liefert eine Zeichenkette. Ein Rechnungserkennungssystem liefert ein strukturiertes Objekt mit Feldzuordnungen.
In Deutschland sind XRechnung und ZUGFeRD inzwischen verbreitet. Beide Formate betten maschinenlesbare XML-Daten direkt in das Dokument ein. Bei diesen Formaten ist OCR nicht erforderlich.
Aus dem Kopf einer Rechnung werden in der Regel die Rechnungsnummer (häufig alphanumerisch mit Präfix wie "RE-"), das Rechnungsdatum, Name und Adresse des Lieferanten sowie die USt-Identifikationsnummer (Format DE123456789) ausgelesen. Für die automatisierte Zahlungsauslösung sind IBAN und Fälligkeitsdatum entscheidend.
Auf Positionsebene werden Positionsnummer, Artikelbeschreibung (oft mehrzeiliger Freitext), Menge mit Einheit, Einzelpreis und der zugehörige Steuersatz erfasst. In Deutschland sind das in der Praxis 19, 7 oder 0 Prozent. Bei den Beträgen ist die Tücke meist das Dezimaltrennzeichen, das je nach Lieferantenland mal Komma, mal Punkt ist.
Nettobetrag, Umsatzsteuerbetrag und Bruttobetrag. Die meisten Systeme prüfen, ob diese drei Werte rechnerisch zusammenpassen.
Im ersten Schritt analysiert das System die geometrische Struktur des Dokuments und identifiziert Textblöcke, Tabellen und Logos. Anschließend wandelt die OCR-Komponente die Bildbereiche in maschinenlesbaren Text um; bei gescannten Belegen sollten mindestens 300 DPI vorliegen.
Im dritten Schritt ordnen trainierte Modelle die erkannten Textblöcke konkreten Rechnungsfeldern zu. Die Zuordnung stützt sich auf Position im Dokument, umliegende Schlüsselwörter und das Format der erkannten Werte. Zum Abschluss laufen Plausibilitätsprüfungen: rechnerische Abstimmung der Beträge, USt-IdNr-Abfrage im EU-VIES-Register und Dublettenprüfung gegen bereits erfasste Belege.
| Dokumenttyp | Kopfzeilen-Genauigkeit | Positions-Genauigkeit | Hauptfehlerquelle |
|---|---|---|---|
| PDF nativ (ERP-generiert) | 97-99% | 92-95% | Sonderzeichen in Artikeltexten |
| Scan 300 DPI gerade | 94-97% | 87-92% | Zeilenabgrenzung in Tabellen |
| Scan 200 DPI leicht schräg | 85-92% | 78-85% | OCR-Zeichenfehler, Layoutverlust |
| Smartphone-Foto | 80-90% | 70-82% | Perspektivverzerrung, Beleuchtung |
Bei wiederkehrenden Belegen desselben Lieferanten steigen die Erkennungsraten, sobald das System bestätigte Feldzuordnungen gespeichert hat. In der Praxis sieht man oft einen Sprung von ca. 90 auf über 98 Prozent ab dem zweiten oder dritten Beleg eines Kreditors.
Lido extrahiert strukturierte Daten aus Rechnungen per KI-gestützter Feldextraktion. Das System ist auf wiederkehrende Dokumenttypen ausgelegt: Sobald ein Lieferant einmal erfasst ist, läuft die Erkennung folgender Belege automatisiert. Es gibt einen kostenlosen Tarif, mit dem Sie die Lösung an eigenen Belegen testen können, bevor Sie sich festlegen.
ABBYY FineReader ist eine etablierte OCR-Engine mit langer Marktpräsenz. Für Rechnungserkennung bleibt FineReader allerdings primär ein OCR-Werkzeug; die Feldzuordnung müssen Sie selbst über die ABBYY-Konfiguration einrichten oder eine ergänzende Komponente wie FlexiCapture einsetzen.
Microsoft Lens erfasst Dokumente per Smartphone-Kamera. In Kombination mit AI Builder lassen sich darauf eigene Rechnungsmodelle trainieren. Vorausgesetzt werden eine aktive Power-Automate-Lizenz und ein gewisses Maß an interner Konfigurationskompetenz, da Sie das Modell mit eigenen Belegen anlernen müssen.
DATEV Belegtransfer ist fest in die DATEV-Produktwelt eingebunden und überträgt Belege automatisiert an das Buchhaltungsmandat. Wer ohnehin mit Steuerberater und DATEV arbeitet, hat hier den kürzesten Weg. Außerhalb des DATEV-Ökosystems ist das Werkzeug nicht gedacht.
Candis ist eine cloudbasierte Rechnungsmanagement-Plattform aus Berlin, vor allem auf den deutschen Mittelstand zugeschnitten. Schwerpunkt sind Freigabe-Workflows mit Kostenstellen-Zuweisung; die DATEV-Integration ist Standard.
| Tool | Kostenloser Einstieg | KI-Feldextraktion | DATEV-Export | ZUGFeRD |
|---|---|---|---|---|
| Lido | Ja | Ja, vorkonfiguriert | Strukturiert | Ja |
| ABBYY FineReader | Testversion | Konfigurierbar | Über Schnittstelle | Ja |
| Microsoft Lens + AI Builder | M365-abhängig | Trainierbar | Nein nativ | Eingeschränkt |
| DATEV Belegtransfer | Nein | Ja (DATEV-spezifisch) | Nativ | Ja |
| Candis | Nein | Ja | Ja | Ja |
Die meisten Lösungen bieten einen CSV-Export im DATEV-Format. Wer mit DATEV Unternehmen Online arbeitet, kann zusätzlich die direkte API-Anbindung nutzen. Systeme, die Lieferanten anhand der USt-IdNr oder IBAN wiedererkennen, schlagen gelernte Kontierungen vor und reduzieren so den Aufwand für die Buchhaltung.
Kein System erreicht 100 Prozent Genauigkeit. In der Praxis bewährt sich ein Vier-Augen-Prinzip, bei dem ein Sachbearbeiter die vom System markierten unsicheren Felder prüft. Bestätigte Korrekturen fließen wieder ins Modell zurück, sodass dieselben Fehler bei nachfolgenden Belegen seltener auftreten.
Sinnvoll sind eine USt-IdNr-Prüfung im EU-VIES-System, eine rechnerische Abstimmung von Netto, Steuer und Brutto sowie eine Dublettenprüfung anhand Rechnungsnummer und Lieferant. Ein IBAN-Abgleich mit den Stammdaten gehört ebenfalls dazu, vor allem als Schutz vor Manipulationen wie dem Austausch von Bankverbindungen in Phishing-Rechnungen.
ICR (Intelligent Character Recognition) erreicht bei klar geschriebenen, standardisierten Formularen 80 bis 90 Prozent Genauigkeit. Bei freier Handschrift sinkt die Rate deutlich, weil Trainingsdaten für deutsche Kursivschrift dünn sind. Eine manuelle Vorkontrolle ist in diesen Fällen sinnvoll.
Digitale Rechnungen aus ERP enthalten eingebetteten Text, OCR liefert nahe 100 Prozent Genauigkeit. Gescannte Rechnungen sind pixelbasiert; Fehler entstehen durch Bildqualität und Ausrichtung.
ZUGFeRD-fähige Systeme lesen die eingebettete XML direkt aus und umgehen OCR vollständig. Stellen Sie sicher, dass Ihr System ZUGFeRD-Profile 2.1 sowie XRechnung 3.0 unterstützt.
Aus DSGVO-Sicht sollten Sie prüfen, ob die Verarbeitung auf EU-Servern erfolgt und ob ein Auftragsverarbeitungsvertrag nach Art. 28 DSGVO vorliegt. Die Verschlüsselung sollte TLS 1.2 oder höher in der Übertragung und AES-256 für gespeicherte Daten umfassen, und im Vertrag sollten Löschfristen geregelt sein. Eine ISO-27001-Zertifizierung des Anbieters ist eine sinnvolle Bewertungsgrundlage, ersetzt aber keine eigene Prüfung.
Die meisten gängigen Systeme unterstützen mehrere Sprachen. Entscheidender als die reine Spracherkennung ist die Normalisierung. Datumsformate, Dezimaltrennzeichen und Steuerbezeichnungen variieren je nach Land. Ein System, das eine englische Rechnung mit "VAT 19%" sauber auf den deutschen Umsatzsteuersatz abbildet, ist im Tagesgeschäft praktischer als eines, das nur die Zeichen korrekt liest.