Tipp Nr. 05 · Kosten
Output-Tokens sind der Kostentreiber
Output kostet meist ein Mehrfaches des Inputs. Kurze, präzise Antworten sparen real Geld.
Problem Die API-Rechnung ist höher als erwartet, obwohl die Eingaben kurz sind.
So geht’s
- Begrenze die Antwortlänge bewusst – verlange Stichpunkte statt Aufsätze, wenn das reicht.
- Vermeide es, lange Kontexte unnötig oft mitzusenden; gib nur die wirklich relevanten Informationen.
- Behalte im Blick, dass Token-Zahlen vom Tokenizer abhängen und zwischen Modellgenerationen nicht eins zu eins vergleichbar sind.
Weitere Tipps
PromptingSag konkret, was du willstDie meisten schlechten Antworten sind schlecht gestellte Fragen. Format, Zielgruppe und Umfang vorgeben.PromptingZeig statt beschreib: Beispiele gebenEin, zwei Beispiele für das gewünschte Ergebnis (Few-shot) wirken oft stärker als jede Erklärung.PromptingSchwere Aufgaben Schritt für Schritt lösen lassenBei Logik, Mathe oder mehrstufigen Aufgaben hilft die Bitte, vor der Antwort laut zu denken.