Die Magie von KI: Die Top 5 LLM-Funktionen von plusmeta

KI
Metadaten
Software
Eva-Maria Wolf

von Eva-Maria Wolf

Juni 13, 2024

Die Magie von KI: Die Top 5 LLM-Funktionen von plusmeta

Large Language Models sind in aller Munde und es ist wirklich beeindruckend, was sie leisten können: Ein Gedicht für die Mama zum Geburtstag, das Schreiben von Code oder die Antwort auf eine Frage – es gibt zahlreiche Beispiele. Generative-AI-Anwendungen (GenAI) wie Chat GPT liefern erstaunlich gute Ergebnisse und sind mindestens eine super Inspirationsquelle.

Auch für die Technische Dokumentation bieten sich neue Möglichkeiten, mit Künstlicher Intelligenz Zeit und Nerven zu sparen. Im folgenden Blogartikel stellen wir daher unsere Top 5 LLM-Funktionen vor, die wir in der plusmeta Plattform nutzen.

Was sind LLM? Und was versteht man unter generativer KI?

Generative KI umfasst alle KI-Technologien, die neue Inhalte erzeugen können. Dies schließt Text, Bilder, Musik, Videos und andere Formen von Daten ein. Dabei kommen fortschrittliche Algorithmen aus dem Bereich des maschinellen Lernens und künstlichen neuronalen Netze zum Einsatz. Wenn es darum geht Texte oder Sprache zu generieren sind das in der Regel Large Language Models (LLM).

LLMs sind neuronale Netzwerke, die auf riesigen Mengen von Textdaten vortrainiert wurden und so in der Lage sind, Sprache zu verstehen und zu generieren. Beispiele sind GPT-4, BERT oder Llama. Solche Modelle können Aufgaben wie Textvervollständigung, Übersetzung, Zusammenfassung, Beantwortung von Fragen und mehr übernehmen.

Übersicht KI-Methoden und Modelle Einordnung von KI-Methoden und Modellen • Quelle: plusmeta

Auch in plusmeta setzen wir LLMs für verschiedene Funktionen ein. Nachfolgend beschreiben wir, welche davon unsere Top 5 LLM-Funktionen in plusmeta sind:

Top 5: Definition basierte Klassifikation

Wenn es darum geht, große Bestandsdatenberge nachträglich mit neuen Metadaten zu versehen, hat KI einen entscheidenden Vorteil: Sie ist schnell und liefert reproduzierbare Ergebnisse. Mit regelbasierten Verfahren kommt man ohne Training schnell ans Ziel. Alles, was man braucht, ist eine Liste der möglichen Werte. Allerdings kommen regelbasierte Verfahren an ihre Grenzen, wenn keine eindeutigen Indikatoren im Text enthalten sind.

Large Language Models bieten den Vorteil, dass sie tiefer in den Text einsteigen können und nicht auf der Ebene der Zeichen bleiben. Sie rechnen quasi den Sinn jedes Textabschnitts in Zahlen um. Wenn man also mit regelbasierten Verfahren an die Grenze kommt, kann LLM-Klassifikation ihre Vorteile ausspielen.

Auch wenn Large Language Models auf abertausenden Dokumenten trainiert wurden, kennen sie von selbst nicht die Klassifikationskategorien. Man muss sie dafür trainieren, damit sie spezifisches Wissen aufnehmen.

Durch Definitions-basierte Klassifikation kann ein aufwendiges Training mit vielen hundert Trainingsdatensätzen umgangen werden und superspezifisches Produkt- oder Unternehmenswissen integriert werden. Die Basis bildet eine Liste der möglichen Werte sowie jeweils eine griffige Definition zu jedem Metadatenwert. Wer auf Standards setzt, hat den Vorteile, dass hier die Definitionen in der Regel für die standardisierten Werte bereits vorhanden sind, z. B. in iiRDS oder ECLASS.

So geht’s in plusmeta:

Für das Anlegen der Klasse verwenden Sie einfach die Vorlage „Klasse (LLM)“. Ein passendes Prompt-Template übernimmt die Anfrage an ein LLM. Welches LLM verwendet werden soll, kann im Prompt-Template übrigens angepasst werden. Zur Auswahl stehen aktuell: Claude, Llama 2 oder 3 sowie ChatGPT. Das Feld „Beschreibung“ im Knowledge Graph nimmt die Definition auf.

Das Ergebnis ist auf den ersten Blick nicht von einer „normalen“ Klassifikation mit Regelbasierten Vorgehen oder Machine Learning unterscheidbar. Erst, wenn man mit der Maus über den Metadatenindikator fährt, wird sichtbar, dass hier LLM als Verfahren genutzt wurde.

Definition basierte Klassifikation mit LLM in plusmeta Definition basierte Klassifikation mit plusmeta • Quelle: plusmeta

Top 4: Zusammenfassungen schreiben lassen

Um schnell erfassen zu können, welche Inhalte in einem mehrseitigen Dokument oder einer unübersichtlichen Wiki-Seite zu finden sind, kann eine Zusammenfassung helfen. Manche Standards, wie bspw. die VDI 2770, fordern sogar eine Kurzzusammenfassung pro Dokument. Ein solche kann in plusmeta nun leicht generiert werden.

Wie geht’s in plusmeta?

Für das Anlegen einer Eigenschaft für die Zusammenfassung gibt es in der Eigenschaften-Ansicht ein passendes Template im Dialog „Eigenschaft erstellen“. Durch die Verwendung der Vorlage wird direkt ein passendes Konfigurationsobjekt verknüpft. Es ist aber auch möglich ein eigenes Konfigurationsobjekt zu verknüpfen und das Prompt-Template anzupassen, z.B. um die Zeichenanzahl oder die Ausgabesprache zu beeinflussen.

Zusammenfassung mit KI schreiben lassen in plusmeta Zusammenfassung schreiben lassen mit plusmeta • Quelle: plusmeta

Top 3: Metadaten übersetzen lassen

Metadaten sind in plusmeta in mehreren Sprachen pflegbar. Das hat den Vorteil, dass mit den regelbasierten Verfahren die Metadatenerkennung für alle Sprachen funktioniert, in denen auch die Metadaten vorliegen.

Kommt ein Text in einer neuen Sprache, ist das auch kein Problem. Denn plusmeta kann mit LLM-Unterstützung die Übersetzung einfach für uns übernehmen.

Wie geht’s in plusmeta?

In der Eigenschaften-Ansicht können Superuser mit entsprechenden Berechtigungen im Eigenschaft-bearbeiten-Dialog die gewünschten Sprachen hinzufügen. Mit einem Klick auf die LLM-Schaltfläche wird die Übersetzung angestoßen. Das Ergebnis wird direkt im Feld angezeigt.

Metadaten übersetzen lassen mit KI in plusmeta Metadaten übersetzen lassen mit KI in plusmeta • Quelle: plusmeta

Top 2: Indikatoren finden

Zum Klassifizieren von Inhalten, z. B. mit der Produktlebenszyklusphase, für die ein Topic gültig ist, sind Indikatoren wichtig. Je mehr solcher „Hinweiswörter“ vorhanden sind, desto leichter fällt es der KI eine korrekte Zuordnung zu machen. Solche Hinweiswörter können Synonyme, alternative Benennungen oder Abkürzungen sein. LLMs können uns dabei unterstützen, passende Indikatoren automatisiert zu finden.

So geht’s in plusmeta

Überall, wo man in plusmeta Indikatoren hinzufügen kann, gibt es bei entsprechend freigeschalteter Berechtigung nun ein „Zauberstabsymbol“. Indikatoren kann man beispielsweise im Eigenschaft-bearbeiten Dialog oder direkt in der Metadaten-prüfen-und-vergeben-Ansicht im „Chip“ des Metadatenwerts ergänzen.

Ein Klick auf die LLM-Schaltfläche genügt, um den Prozess anzustoßen. Alle Ergebnisse werden direkt eingetragen. Anhand der blauen Einfärbung erkennen Sie die neu dazugekommen Indikatoren auf den ersten Blick und können sie ggf. Bearbeiten. Die neuen Indikatoren werden dann automatisch im Wissensgraph gespeichert.

Sie können weiterhin auch manuell Indikatoren hinzufügen oder aus der Liste der LLM-Vorschläge auswählen.

Metadaten Indikatoren finden mit KI in plusmeta Metadaten Indikatoren finden mit KI in plusmeta • Quelle: plusmeta

Top 1: Technische Daten extrahieren

Als Menschen können wir ziemlich leicht auch noch so komplexe Tabellen lesen. KI tut sich damit häufig schwer. An der Auswertung von Technischen Datentabellen arbeiten wir daher gerade auch in unserem Forschungsprojekt KREEN. Hier liegt der Fokus auf der layoutbasierten Auswertung von Tabellen.

Doch auch schon mit den rein textbasierten LLMs lassen sich beeindruckende Ergebnisse erzielen. Durch die automatisierte Extraktion Technischer Daten aus Dokumenten kann man viel Zeit sparen und Fehler vermeiden, die sich beim manuellen Abtippen leicht einschleichen können.

Wie geht’s in plusmeta?

Für die Technischen Daten gibt es zwei Möglichkeiten: Sie können ein Prompt-Template nutzen und in ein Feld alle Technischen Daten schreiben lassen oder Sie erfassen die Technischen Daten strukturiert, je in einem Feld und mit Einheit.

Das Vorgehen ist dabei ähnlich, nur die Prompts in den Konfigurationsobjekten unterscheiden sich. Bei der unstrukturierten Ausgabe könnte es beispielsweise wie folgt lauten: „Welche Technischen Daten sind im Text enthalten?“.

Für die strukturierte Ausgabe brauchen wir eine Eigenschaft, die das Ergebnis aufnehmen kann. Sie hat einen passenden Datentyp, z.B. „Zahl“ und die Information zur Einheit, z. B. „kg“. Beim Anlegen der Eigenschaft hilft die Vorlage “Technische Daten“.

Durch die Vorlage wird automatisch eine Konfiguration verknüpft, die das LLM dazu auffordert nach dem Technischen Datum zu suchen und nur die Zahl ohne Erklärung auszugeben.

Technische Daten extrahieren mit KI in plusmeta Metadaten Indikatoren finden mit KI in plusmeta • Quelle: plusmeta

Fazit

LLMs können wertvolle Unterstützung liefern und viel Zeit einsparen. Für eine kontinuierliche Qualitätssicherung empfehlen wir einen Human in the Loop (menschliche Prüfinstanz), um mindestens stichprobenartig die Ergebnisse zu prüfen. So arbeiten Mensch und Generative KI Hand in Hand und ermöglichen die gewinnbringende und rechtssichere Nutzung dieser revolutionären Technologie in der Technischen Dokumentation.

Und es gibt seit der Quanos Connect noch ein weiteres LLM-Feature, dass die hier beschriebenen noch toppt. Diese Funktion „plusmeta Insights“ stellen wir in einem unserer nächsten Blog-Artikel ausführlich vor.

Sie wollen nun mehr über plusmeta erfahren oder haben einen konkreten Anwendungsfall für die plusmeta KI? Dann vereinbaren Sie eine unverbindliche Demo. Weitere Fragen beantworten wir Ihnen auch gerne per E-Mail.