Symbolbild: Mann in Office-Launch

Document Information Extraction: Vom Kundenproblem zur KI-Lösung

Am Anfang stand ein konkretes Kundenproblem, am Ende eine KI-basierte, weit über die ursprünglichen Anforderungen hinaus nutzbare Lösung. Wie es dazu kam.

Wenn ich heute auf unsere Document Information Extraction Lösung schaue und mir überlege, wo sie mittlerweile überall Verwendung findet, denke ich oft: So sollten die Dinge immer laufen – was sie aber leider nicht immer tun.

Die grundsätzliche Herausforderung bei der Entwicklung von KI-Lösungen

Der grundsätzliche Ansatz bei uns im Data Science Team ist: Ein Kunde hat eine individuelle Problemstellung und darauf entwickeln wir eine individuelle Lösung. Natürlich nutzen wir dabei alles, was schon mal entwickelt wurde bzw. was schon irgendwo „da ist“, um die Lösung i. S. d. Kunden möglichst schlank zu halten.

Am Anfang ist also immer das Kundenproblem (bzw. der Kundenwunsch). Aber es ist oftmals auch so, dass wir selbst im Team Ideen für einen coolen Use Case haben. Aber da wir ja nicht bei „Jugend forscht“ sind, werden Konzepte ohne Kundenauftrag dahinter natürlich nicht einfach mal so umgesetzt, sondern kommen in einen „Ideenspeicher“.

Wenn man aber hinter einer solchen Idee steckt, denkt man sich hin und wieder: „Boah, das ist doch cool, warum will das denn keiner?“ Die Crux ist natürlich, dass diese Konzepte nur bei uns im Team zirkulieren – woher soll jemand von außerhalb denn wissen, dass wir bei einem bestimmten Thema eigentlich schon in den Startlöchern stehen?

Bei unserer Dokument Information Extraction Lösung lief gewissermaßen alles perfekt: Wir haben aus einem sehr konkreten Kundenproblem heraus eine Custom AI Lösung entwickelt haben, die inzwischen in vielen unterschiedlichen Szenarien funktioniert.

Hintergrund

Document Information Extraction

Die Document Information Extraction Lösung der All for One nutzt Künstliche Intelligenz, um Inhalte aus Dokumenten und Bildern auszulesen und in digitale Daten zu überführen. Anders als eine klassische OCR-Software beschränkt sie sich nicht auf die reine Texterkennung, sondern geht einen Schritt weiter. Die KI erkennt, welche Bedeutung bestimmte Informationen haben, und ordnet ihnen eine Semantik zu. So wird beispielsweise nicht nur eine Nummer ausgelesen, sondern gleichzeitig verstanden, dass es sich dabei um eine Rechnungsnummer handelt.

Durch diese Kontextualisierung können Daten eindeutig kategorisiert und zuverlässig identifiziert werden. Die Lösung verbindet also die Extraktion von Inhalten mit einer semantischen Analyse, was die Datenqualität erheblich steigert. Anschließend werden die gewonnenen Informationen in strukturierte Formate überführt, die eine nahtlose Weiterverarbeitung ermöglichen. Über Schnittstellen können die Daten direkt in Zielsysteme wie SAP eingespielt und dort weiterverarbeitet werden. Damit entsteht ein durchgängiger digitaler Prozess, der sowohl Effizienz als auch Genauigkeit erhöht.

Somit bietet die Lösung Unternehmen einen deutlichen Mehrwert, da sie manuelle Arbeitsschritte reduziert, Fehler vermeidet und gleichzeitig die Integration in bestehende Systeme erleichtert.

Mehr erfahren

Am Anfang stand die automatisierte Rechnungserkennung

Ausgangspunkt war ein Pain, den viele Kunden mit dem Rechnungseingang hatten: Nach dem Release einer neuen Version des SAP Rechnungscockpits, war ein bei Anwendern geschätztes Tool, das bei der Rechnungserfassung unterstützt hat (ansatzweise auch schon mit KI, allerdings mehr Template-basiert), nicht mehr lizensiert und unsere Kollegen aus der SAP-Beratung wurden vielfach gefragt: „Was machen wir jetzt?“

Glücklicherweise kam dann eine Beratungskollege zu uns ins Data Science Team und fragte, ob wir da nicht ‘etwas mit KI machen‘ könnten – konnten wir natürlich.

Wir hatten dazu schon passende Vorüberlegungen und Konzepte, die wir nutzen konnten und so hatten wir nach einigen Schleifen gleich eine Lösung. Die konnte dann – äußerst zuverlässig – Rechnungen automatisch einlesen, die relevanten Informationen extrahieren und direkt ins Rechnungscockpit zurückspielen. Und zwar mit Abgleich gegen die Stammdaten, sauber integriert in SAP. Die Pilotkunden waren begeistert.

Von Rechnungen zu unstrukturierten Daten im Allgemeinen

Doch beim Thema Rechnungen blieb es nicht lange. Denn schnell wurde deutlich, dass der eigentliche Pain grundsätzlicher war. Fast alle Unternehmen haben mit unstrukturierten Dokumenten zu tun. Tabellen, Lieferscheine, Bestellungen – oft eingescannt, abfotografiert, in schlechter Qualität oder schlicht nicht digitalisiert. Die relevanten Informationen manuell abzutippen und in die entsprechenden Systeme einzutragen, kostet Zeit, Nerven und bindet Fachkräfte, die woanders viel dringender gebraucht würden.

Der entscheidende Moment war dann, als ein Kunde auf uns zukam und meinte: „Ihr habt doch schon Rechnungen verarbeitet – könnt ihr nicht auch Tabellen aus Bestellungen auslesen? Wir tippen die alle manuell ab.“

Technisch waren wir vorbereitet. Wir hatten schon länger über Tabellenerkennung nachgedacht, aber noch nichts umgesetzt. Als die Anfrage kam, haben wir gesagt: „Alles klar, machen wir.“ Und wenige Wochen später hatten wir das erste Modell im Einsatz.

So entstand Stück für Stück etwas, das weit über Rechnungen hinausgeht. Wir haben gelernt: Sobald irgendwo jemand Dokumente manuell überträgt, gibt es Potenzial für unsere Lösung.

Und wir konnten eine Plattform-Architektur entwickeln, die beides erlaubt:

  • Generische Modelle, wie für Rechnungen, die sofort funktionieren und wenig Anpassung brauchen.
  • Kundenspezifische Modelle, die wir gezielt für individuelle Dokumenttypen trainieren.

Das Schöne daran: Frontend und Backend sind fix, die Infrastruktur steht. Der Aufwand steckt nur im Training des Modells – und das geht schnell.

Fazit: Kundenfeedback als Motor

Besonders spannend finde ich, wie eng diese Entwicklung mit den Kunden zusammenhängt. Viele Ideen kamen nicht aus unserem Elfenbeinturm, sondern direkt aus Gesprächen:

  • Wir haben hier Lieferscheine, die sind alle unterschiedlich – könnt ihr das?“
  • „Unsere Bestelltabellen liegen nur als Scan vor – könnt ihr daraus Daten machen?“

Jedes Mal war unsere Antwort: „Lasst uns ein paar Dokumente sehen, wir probieren es aus.“

Ich mag diesen Ansatz: Der Kunde schickt uns zehn Dokumente, wir schauen eine Stunde drauf und präsentieren im nächsten Termin, was möglich ist. Fast immer führt das zu einem Aha-Effekt – und zu einer konkreten Lösung.

Also wenn auch Sie ein Problem haben, von dem Sie denken, dass man es mit KI lösen könnte – sprechen Sie uns einfach an und lassen Sie uns gemeinsam darauf schauen.

Gerne können Sie sich auch direkt an mich wenden: Lukas.Petuker@all-for-one.com