KI in bestehenden Produkten integrieren: Schritt für Schritt zur Anwendung
MariuszBild von Mariusz
Mariusz
Software

KI in bestehenden Produkten integrieren: Schritt für Schritt zur Anwendung

Erfahren Sie, wie Sie KI nahtlos in bestehende Softwareprodukte integrieren und dadurch Prozesse optimieren können.

Einleitung

KI-Tools boomen, doch die Welt dreht sich weiter: Statt isolierter Lösungen profitieren Anwender heute mehr von KI-Funktionen direkt in den Tools, die sie täglich nutzen. Meine Meinung ist, dass eigene KI-Tools zwar cool sind, aber die wahre Stärke von KI kommt erst dann zum Tragen, wenn sie nahtlos in bestehende Produkte integriert ist. Die Frage ist also: Was bedeutet das konkret und was ist heute schon möglich?

Anwendungsfälle

Ein spannendes Einsatzgebiet ist das KI-basierte Ausfüllen von Formularen, insbesondere bei der Kontakterfassung. Stellen Sie sich vor, Sie kopieren Kontaktdaten aus LinkedIn oder einer E-Mail in Ihre Zwischenablage, drücken einen Knopf, und das Formular ist automatisch ausgefüllt. Kein mühsames Abtippen mehr, die KI übernimmt das für Sie.

Ein weiterer Anwendungsfall sind KI-basierte Importe. Lose strukturierte Daten können per KI analysiert und in eine verwertbare Form gebracht werden. Ebenso können große Datenmengen automatisch zusammengefasst werden, was enorme Zeitersparnisse mit sich bringt. Auch normale Software profitiert von solchen smarten KI-Funktionen, die den Arbeitsalltag erleichtern und Prozesse effizienter gestalten.

Aber wie leicht oder schwer ist das zu implementieren?

Die gute Nachricht: Mit den Structured Outputs über die OpenAI API ist die Umsetzung einfacher als gedacht. Die Implementierung geht schnell von der Hand, und selbst Entwickler ohne tiefgehende KI-Kenntnisse können solche Funktionen integrieren. Wer Datenschutzbedenken hat, könnte ähnliche Lösungen auch mit einem lokalen LLM umsetzen.

Mein konkreter Anwendungsfall

In meinem aktuellen Projekt habe ich eine Funktion integriert, die Personendaten in einem Formular automatisch ausfüllt. Die Idee dahinter entstand aus der alltäglichen Herausforderung, Kontaktdaten manuell von verschiedenen Quellen wie E-Mails, Visitenkarten oder LinkedIn-Profilen in ein CRM-System zu übertragen. Dieser Prozess ist nicht nur zeitaufwendig, sondern auch fehleranfällig.

Die Herausforderung

Die manuelle Erfassung von Kontaktdaten ist ein notwendiges Übel in vielen Unternehmen. Vertriebsmitarbeiter verbringen wertvolle Zeit damit, Informationen abzutippen, anstatt sich auf ihre Kernaufgaben zu konzentrieren. Hinzu kommt das Risiko von Tippfehlern oder unvollständigen Datensätzen, was die Qualität der Kundenbeziehungen beeinträchtigen kann.

Die Vision

Meine Vision war es, diesen Prozess zu automatisieren und dabei die Benutzerfreundlichkeit zu maximieren. Die KI-Funktion sollte nahtlos in das bestehende "Person erfassen"-Formular integriert werden, ohne den Benutzer zu bevormunden. Wichtig dabei: Der Benutzer hat immer die Wahl, ob er das Formular manuell oder KI-basiert ausfüllen möchte.

Die Umsetzung

Nach einigen Überlegungen entschied ich mich für die Integration der OpenAI API in Kombination mit Zod, einem TypeScript-first Schema-Validator. tRPC kam ebenfalls zum Einsatz, um einen typsicheren Datenaustausch zwischen Frontend und Backend zu ermöglichen.

So funktioniert es im Detail

  1. Daten kopieren

    Der Benutzer kopiert die Personendaten aus einer beliebigen Quelle, zum Beispiel einer E-Mail, einem LinkedIn-Profil oder sogar einem PDF-Dokument, in die Zwischenablage seines Computers. Dabei muss er sich keine Gedanken über das Format oder die Struktur der Daten machen.

  2. Schaltfläche drücken

    Im "Person erfassen"-Formular gibt es nun einen zusätzlichen Button mit der Aufschrift "Per KI ausfüllen". Sobald der Benutzer diese Schaltfläche drückt, startet der automatisierte Prozess. Die herkömmlichen Eingabefelder bleiben natürlich erhalten, sodass der Benutzer weiterhin die Möglichkeit hat, Daten manuell einzugeben oder zu bearbeiten.

  3. Verarbeitung

    Der Inhalt der Zwischenablage wird per tRPC an meine API im Backend geschickt. Hier kommt die erste Hürde: Wie überträgt man sicher und effizient die Daten aus dem Frontend ins Backend? tRPC bietet hier eine elegante Lösung, indem es typsichere Endpunkte bereitstellt, die direkt aus dem TypeScript- Code generiert werden.

  4. KI-Aufruf

    Im Backend angekommen, wird der Text der Zwischenablage mit einem speziellen Prompt und dem zuvor definierten Schema an die OpenAI API geschickt. Der Prompt ist so gestaltet, dass die KI genau weiß, welche Informationen sie extrahieren soll.

    "Extrahiere die Personendaten. Schreibe Texte immer in deutscher Sprache! Wenn du keine Daten findest, lasse den Wert einfach leer und gebe einen Leerstring aus!"

    Das Schema wird mit Zod definiert und entspricht genau dem Datenformat, das im Formular benötigt wird. Dadurch stellen wir sicher, dass die zurückgelieferten Daten den erwarteten Typen und Strukturen entsprechen.

  5. Datenstruktur

    Das Zod-Schema sieht beispielsweise wie folgt aus:

    Loading...

    Dieses Schema dient nicht nur als Validierung, sondern auch als Dokumentation der erwarteten Datenfelder. Es bildet die Grundlage für die Kommunikation zwischen der KI und unserem System.

  6. Ergebnis

    Die KI verarbeitet den Input und gibt die Daten in der gewünschten Struktur zurück. Hier ist es beeindruckend zu sehen, wie genau die KI aus unstrukturiertem Text die relevanten Informationen extrahiert. Selbst aus einem Fließtext wie:

    "Hallo Herr Kogut, anbei die Kontaktdaten von Frau Dr. Anna Müller von der XYZ GmbH. Sie erreichen sie unter a.mueller@xyz.de oder telefonisch unter 0123 456789."

    ...kann die KI die einzelnen Felder korrekt befüllen.

  7. Anzeige

    Das Frontend empfängt die verarbeiteten Daten und übernimmt die nicht leeren Felder in das Formular. Dabei werden bestehende Eingaben nicht überschrieben, sondern nur ergänzt. Der Benutzer sieht sofort, welche Felder automatisch ausgefüllt wurden.

  8. Bestätigung

    Bevor die Daten gespeichert werden, hat der Benutzer die Möglichkeit, alle Felder zu überprüfen und gegebenenfalls zu korrigieren. Dies ist ein wichtiger Schritt, um die Kontrolle beim Benutzer zu belassen und Fehler zu vermeiden.

Besondere Herausforderungen und Lösungen

  • Mehrsprachige Eingaben

    Da die KI Texte in verschiedenen Sprachen verarbeiten kann, musste ich sicherstellen, dass die Ergebnisse immer in Deutsch zurückgeliefert werden. Dies wurde im Prompt entsprechend spezifiziert.

  • Datenschutz

    Bei der Verarbeitung personenbezogener Daten spielt der Datenschutz eine entscheidende Rolle. Durch die Verwendung der OpenAI API werden die Daten an einen externen Dienst gesendet. Um hier DSGVO-konform zu arbeiten, können alternative Lösungen mit lokalen LLMs (Large Language Models) in Betracht gezogen werden.

  • Fehlertoleranz

    Nicht immer sind die Eingaben perfekt formatiert. Die KI muss in der Lage sein, auch aus unvollständigen oder fehlerhaften Daten das Beste herauszuholen. Hier hat sich gezeigt, dass die Modelle erstaunlich robust sind.

Der Technologiestack

Damit eine moderne KI-Funktion auf aktuellen Systemen läuft, wird der folgende Stack verwendet:

  • OpenAI API

    Für die KI-Funktionalität, insbesondere die Verarbeitung natürlicher Sprache und das Extrahieren von Informationen aus unstrukturiertem Text.

  • Zod

    Ein TypeScript-first Schema-Validator für die Definition der Datenstrukturen. Zod ermöglicht eine strikte Typisierung und Validierung der Daten, was besonders in Kombination mit TypeScript enorme Vorteile bietet.

  • tRPC

    Ein TypeScript-RPC-Framework, das den typsicheren Datenaustausch zwischen Frontend und Backend ermöglicht. Es erleichtert die API-Entwicklung, indem es automatische Typdefinitionen generiert.

  • TypeScript

    Die gesamte Anwendung ist in TypeScript geschrieben, was eine starke Typisierung und bessere Wartbarkeit des Codes ermöglicht.

Codebeispiel

Hier ein Ausschnitt aus dem Code, der den Prompt an OpenAI absendet:

Loading...

completion.choices[0].message.parsed enthält die extrahierten Daten im gewünschten Format.

Weitere Möglichkeiten und Ausblick

Die hier beschriebene Funktionalität lässt sich auf viele andere Anwendungsfälle übertragen:

  • Dokumentenverarbeitung

    Automatisches Auslesen von Rechnungen, Verträgen oder anderen Dokumenten und Überführung in strukturierte Daten.

  • Datenmigration

    Beim Umzug von einem alten System in ein neues können Daten automatisch transformiert und validiert werden.

  • Support-Tickets

    Analyse und Kategorisierung von Kundenanfragen, um sie schneller an die richtige Stelle weiterzuleiten.

Fazit

Die KI-basierte Formularerfassung ist eine extrem zeitsparende Funktion. Sie erhöht nicht nur die Effizienz, sondern sorgt auch für Begeisterung bei den Benutzern. Durch die Integration direkt in bestehende Workflows wird die Akzeptanz erhöht und der Mehrwert maximiert.

Wer Datenschutzbedenken hat, kann ähnliche Lösungen auch mit einem lokalen LLM umsetzen. Es zeigt sich: Auch in "langweiligen" Business-Anwendungen kann die Integration von smarten KI-Funktionen einen echten Mehrwert bieten. Die Implementierung geht dabei schneller von der Hand, als man denkt.

Also Augen auf für Integrationsmöglichkeiten, auch in bestehenden Line-of-Business-Anwendungen!

Weitere Informationen über Structured Outputs in der OpenAI API

Über den Autor

Mariusz Kogut beschäftigt sich als freier Softwarearchitekt und Berater mit SaaS- und KI-Anwendungen. Mit seiner Software-Agentur unterstützt er Unternehmen bei der Integration moderner Technologien. Sie erreichen ihn auf Twitter unter @mariuszkogut oder per E-Mail unter mk@handmade-systems.de.


Mariusz, der Gründer von Handmade Systems
NATO
TaxiKomm24
Swiss Life
SweepBusiness

Zünden Sie den Turbo für Ihr Softwareprojekt! 🚀

Nehmen Sie eine Abkürzung und finden Sie in einem 30 Minuten Call heraus, wie Ihnen unsere Experten helfen können, Ihre Softwareentwicklung zu beschleunigen: