Depeschen
Datierte Kurzmeldungen aus der KI-Welt – jede mit Einordnung „Warum relevant" und belegten Quellen. Belegt vor schnell: lieber später und korrekt als sofort und falsch.
Stand: 2026-06-16 · RSS-Feed
20 von 20 Depeschen
Das US-deutsche Start-up Tensordyne (Silicon Valley + München, hervorgegangen aus Recogni) hat seinen 3-nm-Inferenzchip „Napier“ angekündigt. Statt Gleitkomma-Multiplikationen rechnet er im logarithmischen Zahlensystem, das Multiplikationen zu Additionen macht. Der Tape-out ist erfolgt, Bestellungen über 200 Mio. $ lägen vor.
Nach der von Washington erzwungenen weltweiten Abschaltung von Anthropics Fable 5 und Mythos 5 prüft die EU-Kommission die Folgen; ein Sprecher mahnt, solche Schritte dürften Partner „nicht diskriminieren“. Europäische Forscher streiten, ob Europa eigene Foundation-Modelle bauen („Airbus-Moment“) oder den Zugang vertraglich absichern soll.
Daniel Stenberg, Maintainer des in Milliarden Geräten verbauten Open-Source-Werkzeugs curl, nimmt vom 1. Juli bis 3. August 2026 keine Fehler- und Sicherheitsmeldungen an. Grund ist laut seinem Blog die anhaltende Hochlast der letzten Monate und der Erholungsbedarf des kleinen Teams; ein Teil des Drucks geht auf die stark gestiegene Zahl – teils KI-generierter – Sicherheitsmeldungen zurück.
Ein Preprint misst den Benchmark WorkBench neu: Wo der beste Agent (GPT-4) im März 2024 noch 43 % der Büroaufgaben löste und bei 26 % eine schädliche Fehlhandlung beging (etwa eine E-Mail an die falsche Person), schafft der beste Agent im Juni 2026 (Claude Opus 4.8) 89 % bei nur 2,5 % schädlichen Aktionen.
Salesforce kauft die KI-Kundenservice-Plattform Fin (vormals Intercom) für 3,6 Mrd. $. Die Technik soll Agentforce stärken, Salesforces Plattform für unternehmenseigene KI-Agenten. Der Abschluss wird für Anfang 2027 erwartet.
Dutzende IT-Sicherheitsfachleute fordern die US-Regierung in einem offenen Brief auf, die Exportbeschränkungen für Anthropics Modelle Fable und Mythos zurückzunehmen. Sie argumentieren, der Bann nehme ausgerechnet den Verteidigern die besten Werkzeuge zur Schwachstellensuche.
Nvidia hat eine Anleihe-Emission über mindestens 20 Mrd. $ gestartet – die erste seit 2021. Die Erlöse dienen allgemeinen Unternehmenszwecken samt Refinanzierung bestehender Schulden. Die Nachfrage war enorm: Auf dem Höhepunkt lagen Zeichnungsaufträge über rund 85 Mrd. $ vor.
Laut der Tracking-Initiative „Data Center Watch“ (10a Labs) wurden im ersten Quartal 2026 mindestens 75 Rechenzentrums-Projekte im Wert von rund 130 Mrd. $ blockiert oder verzögert – der höchste Wert seit Beginn der Erhebung 2023. Treiber sind Sorgen um Strompreise, Energie- und Wasserverbrauch.
Die US-Regierung hat per Exportkontroll-Anordnung den Zugang zu Anthropics Modellen Fable 5 und Mythos 5 für alle ausländischen Staatsbürger gesperrt – weltweit, auch für ausländische Anthropic-Mitarbeitende. Anthropic befolgt die Anordnung, widerspricht ihr aber.
Tata Consultancy Services rollt Claude an 50.000 Mitarbeitende aus und entwickelt mit Anthropic Claude-basierte Lösungen für Finanzwesen, Gesundheit und öffentlichen Sektor.
Google Cloud hat das „Open Knowledge Format“ (OKF) v0.1 vorgestellt – einen offenen, anbieterneutralen Standard, der Wissen für KI-Agenten als Verzeichnis von Markdown-Dateien mit YAML-Frontmatter beschreibt. Ziel ist, dass Agenten verschiedener Hersteller dieselben Wissensquellen ohne Spezialanbindung nutzen können.
Mit FrontierCode hat das KI-Unternehmen Cognition einen Coding-Benchmark vorgestellt, der nicht nur prüft, ob KI-generierter Code läuft, sondern ob menschliche Maintainer ihn tatsächlich in ein Projekt übernehmen würden. Bewertet werden Korrektheit, Tests, Umfang, Stil und Wartbarkeit anhand von Maintainer-Rubriken.
Google DeepMind legt mit mehreren Partnern ein Förderprogramm über 10 Mio. $ auf, das die Sicherheit interagierender KI-Agenten erforscht. Forschende können sich bis zum 8. August 2026 bewerben.
OpenAI übernimmt das deutsche Start-up Ona – das frühere Gitpod – und integriert dessen Cloud-Entwicklungsumgebungen in Codex. Damit sollen Codex-Agenten Aufgaben stunden- bis tagelang autonom in der Cloud bearbeiten, auch wenn der Rechner des Entwicklers längst aus ist. Finanzielle Konditionen wurden nicht genannt.
Ein Team der University of Twente senkt den Energiebedarf beim LLM-Training um bis zu 14 % – bei nur rund 0,6 % Zeitverlust –, indem es die GPU-Taktfrequenz nicht pro Iteration, sondern pro Rechen-Kernel (rund 40 je Schicht) dynamisch regelt (DVFS). Die 14 % sind ein Laborbestwert (GPT-3-XL auf einer RTX 3080 Ti).
Google hat mit DiffusionGemma ein experimentelles offenes Modell veröffentlicht, das Text nicht mehr Token für Token erzeugt, sondern ganze Blöcke gleichzeitig – per Diffusion. Das Modell (26 Mrd. Parameter, Mixture-of-Experts) soll auf GPUs bis zu 4× schneller schreiben, allerdings bei geringerer Ausgabequalität als das reguläre Gemma 4.
Apple hat AFM 3 vorgestellt – die dritte Generation seiner hauseigenen Foundation Models. Auf dem Gerät laufen ein 3-Mrd.-Parameter-Modell (AFM 3 Core) und ein neues 20-Mrd.-Sparse-Modell (AFM 3 Core Advanced); in der Private Cloud Compute ergänzt ein Pro-Modell komplexes Reasoning und agentischen Tool-Use. Entwickler erhalten im Lauf des Sommers Zugriff über das Foundation-Models-Framework.
In „When AI Builds Itself“ legt das Anthropic Institute Belege vor, dass KI bereits mehrere Schritte der KI-Entwicklung beschleunigt: Claude schreibt nach Unternehmensangaben über 80 % des bei Anthropic gemergten Codes, Engineers liefern rund 8-mal mehr Code pro Quartal als früher. Anthropic argumentiert, die Gesellschaft solle die Option haben, die Frontier-Entwicklung zu verlangsamen oder vorübergehend zu pausieren.
Cloudflare kauft VoidZero, das von Vue-Schöpfer Evan You gegründete Unternehmen hinter der JavaScript-Toolchain Vite (Vitest, Rolldown, Oxc, Vite+). Vite ist mit über 130 Millionen wöchentlichen Downloads De-facto-Standard im Web-Frontend. Die Werkzeuge bleiben quelloffen unter MIT-Lizenz; Cloudflare legt einen unabhängigen Vite-Ökosystem-Fonds über 1 Million US-Dollar auf.
Google DeepMind hat Gemma 4 12B veröffentlicht – ein offenes, multimodales Modell mit 12 Mrd. Parametern, das Text, Bild und Audio verarbeitet und klein genug ist, um lokal auf Laptops mit 16 GB RAM zu laufen. Eine „encoder-freie“ Architektur verzichtet auf separate Bild- und Audio-Encoder.