FAQ
Kurze, belegte Antworten auf häufige Fragen rund um KI-Sprachmodelle. Ausführlicher steht alles in den Wissens-Artikeln.
Künstliche Intelligenz ist der Oberbegriff für Systeme, die Aufgaben lösen, die als „intelligent“ gelten. Maschinelles Lernen ist ein Teilgebiet, bei dem Systeme aus Daten lernen statt fest programmiert zu werden.
Ein großes Sprachmodell (LLM) ist eine spezielle Ausprägung davon: ein neuronales Netz, das auf Text trainiert wurde und das wahrscheinlichste nächste Textstück vorhersagt.
Ein Token ist die kleinste Verarbeitungseinheit eines Sprachmodells – oft ein Wortteil. Text wird vor der Verarbeitung in Tokens zerlegt; Kosten und Kontextverbrauch werden in Tokens gerechnet.
Als Faustregel entspricht im Englischen ein Token etwa vier Zeichen. Deutsch braucht wegen langer Komposita tendenziell mehr Tokens pro Wort.
Weil ein Sprachmodell wahrscheinliche Sprache erzeugt, keine geprüften Fakten. Klingt eine erfundene Antwort statistisch plausibel, gibt das Modell sie trotzdem aus – das nennt man Halluzination.
Mindern lässt sich das durch das Mitgeben von Quellen, die Bitte um Unsicherheits-Angaben und konsequentes Nachprüfen wichtiger Aussagen. Ganz ausschließen lässt es sich nicht.
Nicht zwangsläufig. Über Parameter wie die Temperatur lässt sich die Varianz senken, aber ob eine Ausgabe vollständig reproduzierbar ist, ist in der Praxis umstritten – Hardware und Implementierung können Restvarianz erzeugen.
Für Workflows, die exakte Wiederholbarkeit brauchen, sollte man sich nicht allein auf die Temperatur verlassen.
Nur begrenzt. Das Trainingswissen endet zu einem Stichtag (Knowledge Cutoff). Aktuelles weiß ein Modell nur, wenn ihm zur Laufzeit Information mitgegeben wird – über Websuche, Tools oder RAG.
Cloud-Modelle werden meist je Million Tokens abgerechnet, getrennt nach Eingabe und Ausgabe; Output ist in der Regel deutlich teurer. Kurze, präzise Antworten senken die Kosten spürbar.
Aktuelle Preise je Modell findest du im Modell-Katalog. Open-weight-Modelle lassen sich alternativ lokal betreiben – ohne Token-Gebühr, aber mit Hardware- und Betriebsaufwand.
Das hängt von Anbieter und Tarif ab. Manche nutzen Eingaben für Training oder Logging, andere – besonders in Geschäfts- und Enterprise-Tarifen – schließen das aus. Vor sensiblen Daten immer die Datenschutz- und Nutzungsbedingungen prüfen.