Techniken
KI richtig nutzen: Prompting, RAG, Agenten
Der Unterschied zwischen frustrierenden und nützlichen Ergebnissen liegt selten am Modell, sondern an der Nutzung. Diese Seite gibt einen Überblick über die wichtigsten Techniken – von der Formulierung bis zur Anbindung externer Werkzeuge.
Prompting-Grundlagen
Gute Prompts sind konkret. Bewährt haben sich: eine klare Instruktion, relevanter Kontext, gegebenenfalls eine Rolle, ein, zwei Beispiele für das gewünschte Format (Few-shot) und – bei kniffligen Aufgaben – die Aufforderung, Schritt für Schritt vorzugehen (Chain-of-Thought).
Die meisten schlechten Antworten sind schlecht gestellte Fragen. Wer Format, Zielgruppe und Umfang vorgibt, spart sich Nacharbeit.
Merksatz Erst Kontext, dann Frage. Sag, was du willst, für wen, in welchem Format.
RAG – Retrieval-Augmented Generation
Bei RAG werden zur Laufzeit passende Dokumente gesucht und dem Modell als Kontext mitgegeben. So antwortet es auf Basis deiner Daten und aktueller Quellen statt nur aus dem Training – das erhöht Aktualität und Faktentreue und liefert nachvollziehbare Belege.
RAG ist oft die günstigere und flexiblere Alternative zum Nachtrainieren, wenn es vor allem um Wissen geht, das sich ändert.
Embeddings & Vektorsuche
Damit RAG die passenden Dokumente überhaupt findet, braucht es ein Maß für inhaltliche Ähnlichkeit. Genau das liefern Embeddings: Ein Modell bildet Text (oder Bild, Audio) auf einen Vektor ab – eine lange Liste von Zahlen –, sodass inhaltlich Ähnliches geometrisch nah beieinanderliegt. „Arzt“ und „Ärztin“ landen dicht zusammen, „Arzt“ und „Schraubenschlüssel“ weit auseinander.
Diese Vektoren werden in einer Vektordatenbank abgelegt; zur Laufzeit sucht das System die zur Frage nächstgelegenen Treffer und reicht sie als Kontext ans Modell. Embeddings sind damit der Motor hinter semantischer Suche und RAG – und der Grund, warum man nicht mehr auf exakt gleiche Stichwörter angewiesen ist.
Merksatz Embeddings machen Bedeutung messbar: Ähnliches liegt nah beieinander. Das ist der Motor der semantischen Suche.
Tool-Use & Function-Calling
Moderne Modelle können definierte Werkzeuge aufrufen – eine Rechenfunktion, eine Datenbankabfrage, eine API. Das Modell entscheidet, wann ein Tool nötig ist, und arbeitet mit dessen Ergebnis weiter. So werden aus reinen Textantworten Aktionen.
Tool-Use ist die Grundlage für zuverlässige Mathematik, Live-Daten und die Anbindung an bestehende Systeme.
Agenten
Agenten sind Systeme, in denen ein Modell mehrschrittig plant, Werkzeuge nutzt, Zwischenergebnisse prüft und sich selbst korrigiert – etwa um eine Rechercheaufgabe oder eine Code-Änderung autonom zu erledigen.
Mehr Autonomie bedeutet mehr Nutzen, aber auch mehr Fehlerquellen. Klare Aufgaben, Prüfschritte und Rückfall-Optionen sind hier entscheidend.
MCP – Model Context Protocol
Das Model Context Protocol ist ein offener Standard, um KI-Anwendungen mit externen Systemen zu verbinden – Datenquellen, Werkzeuge, Workflows. Sein Bild dafür: ein „USB-C-Anschluss für KI“, der einmal gebaut und überall angebunden werden kann.
Statt für jede App eine eigene Integration zu schreiben, sprechen Clients und Server eine gemeinsame Sprache. MCP wird inzwischen breit von KI-Clients und Entwicklungswerkzeugen unterstützt.
Fine-tuning – oder doch Prompting/RAG?
Fine-tuning passt die Gewichte eines Modells an einen eigenen Datensatz an – anders als Prompting und RAG, die das Modell unverändert lassen und nur den Kontext steuern. Das klingt mächtig, ist aber selten der erste richtige Hebel: Es kostet Daten, Rechenzeit und Pflege und wird mit jedem neuen Basismodell wieder fällig.
Eine brauchbare Heuristik: RAG für Wissen und Fakten (die sich ändern), Fine-tuning für Verhalten, Stil und Format (ein bestimmter Ton, ein striktes Ausgabeschema). Und in dieser Reihenfolge: erst Prompting und RAG ausreizen, bevor man nachtrainiert.
Merksatz RAG für Wissen, Fine-tuning für Verhalten und Stil. Erst Prompting und RAG ausschöpfen, dann erst nachtrainieren.