Extraktive vs. Generative KI: Warum der Unterschied für die intelligente Dokumentenverarbeitung wichtig ist
Spätestens seit dem Start von ChatGPT Ende 2022 ist das Thema Künstliche Intelligenz branchenübergreifend in aller Munde und hat auch im Bereich der intelligenten Dokumentenverarbeitung grosses Potenzial. - Der Begriff wurde lange vor der jüngsten KI-Welle geprägt und beschreibt die intelligente Extraktion und Verarbeitung von Daten aus strukturierten und unstrukturierten Dokumenten, zu denen KI und ML schon immer gehörten (daher "intelligent").
Diese neue Welle hat zu einer Reihe neuer Begriffe geführt, die weit über die engere Funktion der IDP hinausgehen, wobei die am häufigsten verwendeten Begriffe Generative KI (GenAI) und Large Language Models (LLM) sind. Wir konzentrieren uns heute jedoch auf den neu aufkommenden Begriff "Extraktive KI" und warum die Unterscheidung zwischen diesen beiden Begriffen von entscheidender Bedeutung ist, um das volle Potenzial von KI in der IDP auszuschöpfen und sicherzustellen, dass Unternehmen nicht nur ihre Prozesse rationalisieren, sondern auch Vertrauen in ihre Nutzung haben können.
Die generative KI lässt sich in gewisser Weise leicht mit einer Antwort von OpenAI, einem der führenden Anbieter in diesem Bereich, zusammenfassen. Wie die Anwälte von OpenAI in einem laufenden Rechtsstreit kommentierten,
"Es liegt in der Natur der Sache, dass KI-generierte Inhalte wahrscheinlichkeitsbasiert sind und nicht immer den Tatsachen entsprechen. Es besteht ein nahezu allgemeiner Konsens darüber, dass ein verantwortungsvoller Umgang mit KI bedeutet, dass die Ergebnisse vor ihrer Verwendung oder Verbreitung auf ihre Richtigkeit überprüft werden müssen."
Es ist wichtig, sich daran zu erinnern, dass das ultimative Ziel der generativen KI darin besteht, eine Antwort zu liefern - was nicht bedeutet, dass die Antwort, die sie liefert, richtig ist.
Extraktive künstliche Intelligenz hingegen konzentriert sich auf das Herausfiltern spezifischer, relevanter Informationen aus verschiedenen Inhalten und arbeitet eher wie ein hochentwickelter Filter.
Sowohl die generative als auch die extraktive KI arbeiten auf der Basis von Eingabeaufforderungen, d.h. einer reinen Texteingabe, um ein Ergebnis zu erzielen.
Wie generative und extraktive KI in der IDP zusammenarbeiten können
Für die intelligente Dokumentenverarbeitung bedeuten diese Unterschiede, dass es Szenarien gibt, in denen die eine Methode besser geeignet ist als die andere, oder in denen es vorteilhaft sein kann, beide Methoden einzusetzen.
Nehmen wir als Beispiel den Antrag eines neuen Hypothekenkunden, Dies ist sowohl für den Kreditgeber als auch für den Antragsteller eine komplexe, aber wichtige Aufgabe, die in der Regel die Verarbeitung zahlreicher Dokumente wie Ausweise, Kontoauszüge, Kreditberichte, Mietzahlungen, Urkunden, Grundbucheinträge, Immobiliengutachten, Kaufverträge usw. erfordert. Sowohl extraktive als auch generative KI können bei der Optimierung dieses Prozesses eine Rolle spielen.
Extraktive KI eignet sich besonders für Aufgaben, bei denen spezifische Informationen gefunden, strukturiert und validiert werden müssen. Dies ist besonders wertvoll bei längeren Dokumenten, die Daten enthalten, deren manuelle Bearbeitung normalerweise viel Zeit in Anspruch nehmen würde. In unserem Hypothekenbeispiel kann extraktive KI in den frühen Phasen der Bearbeitung eingesetzt werden, um den Prozess des Lesens und Extrahierens von Schlüsselinformationen zu automatisieren und diese in strukturierten Daten bereitzustellen, die leicht in Kreditantragssysteme integriert werden können. Während von der extraktiven KI erwartet werden kann, dass sie Daten mit hoher Genauigkeit produziert, müssen andere Technologien eingesetzt werden, um eine 100%ige Genauigkeit und Entscheidungssicherheit zu erreichen. Diese Technologien sind Kernfähigkeiten des IDP und umfassen HITL (Human-in-the-Loop), Datenbank- und KI-Service-Validierung.
Generative KI ist dagegen von vornherein näherungsorientiert. Sie ist darauf ausgelegt, auf der Grundlage von Mustern in den Daten neue Inhalte zu erstellen oder zu generieren. In unserem Beispiel der Hypothekenbearbeitung kann sie die extraktive KI ergänzen, indem sie die weitere Analyse per Chat erleichtert und personalisierte Mitteilungen erstellt. Wiederum würde die extraktive KI dazu verwendet, Informationen zu extrahieren und für die Überprüfung durch einen Wissensarbeiter zusammenzufassen, während die generative KI dazu verwendet würde, einen Kundenbrief oder eine Empfehlung zu erstellen.
Eine Übersicht der Unterschiede zwischen extraktiver und generativer KI bietet unsere Vergleichsmatrix.
Durch diese leistungsstarke Kombination wird nicht nur der Automatisierungsgrad erhöht, sondern auch ein neues, bisher unerreichbares Maß an Personalisierung und Transparenz erreicht und verbessert.
Zusammenfassend lässt sich sagen, dass die Hauptunterschiede zwischen extraktiver und generativer KI in ihren primären Funktionen und Ergebnissen liegen. Der Hauptvorteil der Anwendung von extraktiver KI in der Dokumentenverarbeitung liegt in der Identifizierung und Extraktion spezifischer Informationen aus vorhandenen Inhalten, um Daten zu strukturieren, die Effizienz zu steigern und die Genauigkeit zu erhöhen, während sich die generative KI auf die Erstellung neuer Inhalte konzentriert, die komplexe Zusammenhänge verstehen und sich an verschiedene Szenarien anpassen können, wodurch sowohl die Benutzer- als auch die Kundenerfahrung verbessert wird.
Letztendlich bieten beide Vorteile für Unternehmen, aber der Schlüssel liegt in der optimalen Orchestrierung dieser Dienste und Tools, um eine höhere Effizienz und ein besseres Kundenerlebnis zu erzielen und wirklich robuste automatisierte Prozesse bereitzustellen.