Behörden und öffentliche Einrichtungen stehen bei der Verarbeitung von Dokumenten in Fachverfahren vor zahlreichen Herausforderungen. Eine zentrale Schwierigkeit liegt oft in der Bewältigung großer Datenmengen, die effizient organisiert und verwaltet werden müssen. Anträge und Anlagedokumente erreichen die Behörden auf vielen verschiedenen Eingangskanälen. Die Sachbearbeitung steht vor der monotonen Aufgabe, die relevanten Informationen aus den verschiedenen Schriftstücken zusammenzutragen, vorangegangene Korrespondenzen mit dem Kunden zu berücksichtigen und diese gesammelten Daten für die weitere fachliche Bearbeitung zu aggregieren. Dieser Prozess ist bei komplexen Sachverhalten und zeitlicher Distanz aufwändig und fehleranfällig.

Lassen Sie einfach zwischen den Zeilen lesen
So lief es bisher
Zunehmende Menge und Komplexität von Dokumenten und Daten
Mittels Texterkennung haben Behörden heute bereits die Möglichkeit, strukturierte Informationen regelbasiert aus Dokumenten zu extrahieren. Ein signifikanter Nachteil ist die Regelgebundenheit dieser Verfahren. So müssen beispielsweise Regeln implementiert werden, die festlegen, dass sich zum Beispiel eine zu extrahierende Adresse immer im oberen Bereich eines Dokuments befindet.
Behörden sehen sich heute jedoch mit einer zunehmenden Komplexität von Dokumenten und Daten konfrontiert, etwa durch multimediale Inhalte oder verschlüsselte Dateiformate. Dies führt zu einem hohen Aufwand hinsichtlich Anpassung der Extraktionsregeln an diese komplexeren Datensätze, da neue Regeln implementiert und diese anschließend manuell mit vielen Dokumenten getestet werden müssen. Dadurch sind diese Texterkennungsverfahren deutlich fehleranfälliger und teils aufwändiger in der Nachbearbeitung fehlerhaft extrahierter Dokumente.
Die Rolle der KI
Heutzutage wird daher mehrheitlich auf den Einsatz neuester Machine-Learning-Technologien gesetzt. Insbesondere die aktuell prosperierenden Sprachmodelle (Natural Language Processing) eignen sich sehr gut dazu, Dokumente, die sich sowohl sprachlich als auch in ihrer Struktur teilweise erheblich voneinander unterscheiden, in fachlich strukturierte Daten zu überführen. Die hohe Genauigkeit und Flexibilität eines solchen NLP-Modells beruht auf einem Training mit „Weltwissen“. Gelernt wird eine Wahrscheinlichkeitsverteilung für Wortfolgen. Dadurch sind solche Modelle in der Lage, die Semantik des Satzes zu erfassen und damit den Satz sinnvoll zu vervollständigen. Das ermöglicht eine hohe Leistungsfähigkeit. Auch aus langen, unstrukturierten Texten können die benötigten Informationen strukturiert erfasst werden.
Für die Anpassung des Modells an einen spezifischen Anwendungsfall – das „Feintuning“ – werden keine so großen Datenmengen benötigt, wie es bei klassischen Maschine-Learning-Technologien der Fall ist. Häufig reichen 100 Dokumente aus, um das Modell so weit zu trainieren, dass eine zuverlässige Extraktion der Daten erfolgt, unabhängig davon, in welchem Format die Dokumente vorliegen.
Insgesamt bieten die neuen KI-Technologien einen hohen Mehrwert, um die Flut an unstrukturierten Daten effizient und automatisiert verarbeiten zu können.
So könnte es sein
Schnellere Antwortzeiten durch vollautomatische Bearbeitung
Die laufende Anpassung regelbasierter Ansätze und die Nachbearbeitung fehlerhaft verarbeiteter Daten entfallen mit NLP-Modellen. Die relevanten unstrukturierten Daten werden mittels Texterkennung vollautomatisch in das verarbeitende System geladen. Die manuelle Eingabe durch die Sachbearbeitung entfällt und die Weiterverarbeitung kann zu 100 % digital erfolgen. Die KI extrahiert strukturierte Informationen aus unstrukturierten Quellen, das heißt, sämtliche Eingangskanäle der Behörde werden mittels Texterkennung ausgewertet und analysiert. Anhand von NLP werden semantische Zusammenhänge innerhalb der eingereichten Dokumente sowie zu den bereits digital archivierten Dokumenten in der Behörde hergestellt.
Über alle Eingangskanäle hinweg erhält die Sachbearbeitung eine kurze Zusammenfassung des Anliegens sowie der noch offenen Bearbeitungsschritte. Dabei werden auch bereits erfasste Kundendaten sowie Kundenanfragen aus der Vergangenheit berücksichtigt. Sachbearbeitende können sich auf diese Weise schnellstmöglich einen Überblick über auch bei ihnen unbekannte oder komplexe Kundenanliegen verschaffen. Schnelle Antwortzeiten gegenüber externen Stakeholdern werden dadurch ermöglicht.
Sie haben Fragen?
Keine Webseite und keine Broschüre kann das persönliche Gespräch über Ihre Ziele und Ihre Themen ersetzen. Wir freuen uns auf einen Termin bei Ihnen vor Ort.
Product Manager Henrike Oberlack +49 16096707741