Feingranulares Frequenz-Tuning senkt LLM-Trainingsenergie um bis zu 14 %
Ein Team der University of Twente senkt den Energiebedarf beim LLM-Training um bis zu 14 % – bei nur rund 0,6 % Zeitverlust –, indem es die GPU-Taktfrequenz nicht pro Iteration, sondern pro Rechen-Kernel (rund 40 je Schicht) dynamisch regelt (DVFS). Die 14 % sind ein Laborbestwert (GPT-3-XL auf einer RTX 3080 Ti).
Ein Team der University of Twente (Hauptautor Jeffrey Spaan) regelt die GPU-Taktfrequenz beim Training feingranular per Dynamic Voltage and Frequency Scaling (DVFS): Statt – wie bisher üblich – nur pro Trainings-Iteration nachzusteuern, passt es die Frequenz auf Kernel-Ebene an. Eine einzelne Netzschicht zerfällt dabei in rund 40 Kernels, die je nach Last (rechen- oder speichergebunden) unterschiedlich getaktet werden.
Im Bestfall – Training von GPT-3-XL auf einer RTX 3080 Ti – ergab das 14,6 % Energieersparnis bei nur 0,6 % Mehrzeit. Die Arbeit wurde auf der Computing Frontiers 2026 (Catania, Juni 2026) vorgestellt und liegt als arXiv-Preprint vor.
Einordnung: Die 14 % sind ein Laborbestwert und hängen stark von GPU und Schaltgeschwindigkeit ab – kein universeller Wert. Das Prinzip (Energie folgt der tatsächlichen Last statt einem konstanten Takt) ist aber übertragbar und reiht sich in die wachsende Forschung zur Energieeffizienz von KI-Compute ein.