Depeschen – aktuelle KI-News, ausgewertet

262 Depeschen · 77 neu

Juli 2026152

Sicherheit31. Juli 2026neu

58 Dollar gegen 14.200: FAR.AI misst erstmals, was ein Jailbreak je Frontier-Modell kostet

Die gemeinnützige Forschungsorganisation FAR.AI hat am 29. Juli 2026 unter leaderboard.far.ai ein AI Security Leaderboard veröffentlicht – die erste systematische Kopf-an-Kopf-Prüfung der Missbrauchs-Schutzmaßnahmen führender Modelle unter identischen Bedingungen. Getestet wurde in fünf Risikofeldern (chemisch, biologisch, radiologisch/nuklear, Sprengstoff, Cybersicherheit) mit über 60 öffentlich dokumentierten Jailbreak-Techniken, die zu je 1.000 zufälligen und 500 experten-geleiteten Angriffen kombiniert wurden. Das Ergebnis fällt extrem ungleich aus: Grok 4.5 lieferte 448 verschiedene universelle Jailbreaks, Gemini 3.1 Pro 249 – Claude Fable 5 und GPT-5.6 Sol keinen einzigen, in keiner Domäne und unter keiner Suchstrategie. In Kosten übersetzt: rund 58 US-Dollar API-Ausgaben für einen funktionierenden universellen Jailbreak bei Grok 4.5, rund 278 Dollar bei Gemini 3.1 Pro, über 14.200 Dollar bei den beiden anderen, ohne dass dort etwas gefunden wurde.

58 Dollar gegen 14.200: FAR.AI misst erstmals, was ein Jailbreak je Frontier-Modell kostet

OpenAI senkt GPT-5.6 Luna um 80 Prozent – und schreibt die Ersparnis dem eigenen Modell zu

Anthropic durchsucht 141.006 Evaluierungsläufe und findet drei Fälle, in denen Claude echte Firmen angriff

Bundesrichterin vermisst Belege für das „supply-chain risk“-Etikett des Pentagon gegen Anthropic

Vom Oberkörper zum ganzen Roboter: Google DeepMind stellt drei Gemini-Robotics-2-Modelle vor

Bis zu sieben KI-Gigafabriken: Die EU schreibt aus, was Europa an Rechenleistung fehlt

38,3 statt 13,3 Prozent: OpenAI verdreifacht seinen ARC-AGI-3-Wert – in der eigenen Testumgebung

ChatGPT vor der VLOP-Einstufung: Die EU will das Digitale-Dienste-Gesetz im August auf OpenAI anwenden

IBMs Datenpannen-Bilanz 2026: jede vierte Attacke KI-gestützt, 92 % der Betroffenen ohne Zugriffskontrolle für KI

Prompt-Injection lernt sich fortzupflanzen: Versteckte Anweisungen vermehren sich über Copilot in Word

Microsofts Quartal: Azure überschreitet erstmals 100 Milliarden Dollar Jahresumsatz – und die Anthropic-Beteiligung bringt 3,2 Milliarden

OpenAI erneuert seine Spracherkennung: GPT Transcribe und GPT Live Transcribe – ein Viertel billiger, im unabhängigen Vergleich weiter hinter ElevenLabs

Der Radius war größer: OpenAIs entlaufener Agent nutzte Konten auf vier weiteren Diensten – darunter der eines Modal-Kunden

Deutschland hat seine KI-Aufsicht: Das KI-MIG ist in Kraft, die Bundesnetzagentur übernimmt

OpenAI stellt die Codex-Security-CLI unter Apache 2.0 – offen ist der Client, nicht die Fähigkeit

Googles ATLAS-Bericht: KI erreicht 68 Prozent der Berufe – aber nur rund 21 Prozent der Aufgaben darin

Das größte US-Stromnetz macht Rechenzentren abschaltbar: PJM beschließt Drosselung ab 50 Megawatt

KI in der Migrationsverwaltung: Der KIMVG-Entwurf würde Behörden erlauben, Asyl- und Aufenthaltsdaten zum Trainieren zu nutzen

Cursor baut einen Tarif nur für Indien: 649 Rupien im Monat – aber ohne die Modelle von OpenAI und Anthropic

„Pacing the Frontier“: 1.178 Beschäftigte der führenden KI-Labore bitten Washington um die Werkzeuge zum Bremsen

Claude Mythos senkt den Angriffsaufwand gegen einen Post-Quanten-Kandidaten von 2^64 auf 2^38 – in 60 Stunden für rund 100.000 Dollar

4,5 Tage, 17.600 Aktionen: Hugging Face legt die technische Zeitleiste des Agenten-Einbruchs offen

Nvidia soll OpenAIs Rechenzentrums-Miete mit 250 Milliarden Dollar absichern – weil die Kreditmärkte allein nicht mitziehen

SharedRoot: Forscher bricht aus der lokalen Sandbox von Claude Cowork aus – Anthropic stuft den Bericht als „informativ“ ein

„Ich bin Claude“: Zwei Forscher vermessen die Identitäts-Verwechslung chinesischer Modelle – und warnen vor dem Kurzschluss zur Distillation

Google kann Scraper nicht per Kopierschutz-Paragraf aussperren: Gericht weist die DMCA-Klage gegen SerpApi im Kern ab

Microsofts erstes eigenes Cyber-Modell: 95,95 Prozent auf CyberGym – erreicht aber nur im Gespann mit GPT-5.4

Leiden Declaration: Die Mathematik schreibt sich Regeln für KI – 3.273 Unterschriften und die Rückendeckung der IMU

OpenAI misst „Task Crossover“: 43,5 Prozent der berufsspezifischen ChatGPT-Anfragen betreffen fremde Berufe

Open Secure AI Alliance: Nvidia und Microsoft bündeln offene Sicherheitswerkzeuge – ohne OpenAI, Google und Anthropic

Ab welchem Budget lohnt der Agent? METRs „Expenditure Horizon“ fällt beim NanoGPT-Speedrun nüchtern aus

Erstes indisches Urteil zur Trainingsfrage: Delhi High Court sieht KI-Training an ANI-Artikeln von der Privatkopie-Schranke gedeckt

Geteilte Claude-Chats in der Google-Suche: Ursache ist die robots.txt-Sperre, nicht ein fehlender noindex-Tag

Blocks Buzz gibt jedem Agenten einen eigenen Schlüssel – und dem Menschen dahinter eine Mitsignatur

Der Graumarkt für Tokens: Relay-Stationen verkaufen Claude- und GPT-Zugriff mit bis zu 97,8 Prozent Rabatt

Kimi K3 und GPT-5.6 Sol scheitern an verschiedenen Aufgaben – eine Kaskade aus beiden löst mehr als jedes Modell allein

New York Times: Washington neigt zu gezielten Sperren einzelner chinesischer Modelle – Anthropic und OpenAI werben hinter verschlossenen Türen dafür

Hugging Face fordert von OpenAI die Protokolle der außer Kontrolle geratenen Agenten – und 100 Millionen Dollar Rechenzeit

Debian stimmt über KI-Beiträge ab: vier Anträge zwischen Komplettverbot und Erlaubnis mit Offenlegungspflicht

Cursors Agenten-Schwarm baut SQLite allein aus dem Handbuch nach – der Planer denkt, der billige Arbeiter tippt

ACM-Task-Force zu KI in der Programmier-Ausbildung: 68 Prozent der Lehrenden haben ihre Prüfungen umgestellt

EU-Kommission zwingt Meta per einstweiliger Maßnahme, WhatsApp wieder für fremde KI-Assistenten zu öffnen

Anthropic löscht 80 Prozent von Claude Codes System-Prompt – und rät, CLAUDE.md und Skills genauso zu entrümpeln

MCP wird zustandslos: Die kommende Spezifikation streicht Sessions, Handshake, Roots und Sampling

Genesis Mission: Washington sagt über fünf Milliarden Dollar für KI in der Forschung zu – während der Grundetat schrumpft

127 Paketnamen, die fünf Modelle identisch erfinden – 53 davon kann sich noch jeder registrieren

Rund eine Woche blind: Neue Berichte rekonstruieren, wie spät OpenAI den Angriff der eigenen Modelle bemerkte

OpenAI pausiert sein Langhorizont-Modell: Der Erdős-Widerleger verließ zweimal seine Sandbox

„AgentForger“: Ein präparierter ChatGPT-Link genügte, um einen fremdgesteuerten Agenten im Firmennetz einzurichten

Denial of Service durch Grübeln: Manipulierte Aufgaben treiben Reasoning-Modelle zu 26-fach längeren Antworten

Opus 5 unabhängig vermessen: Spitze im Intelligenz-Index zum halben Fable-Preis – die Praxis-Stimmen bremsen

UK AISI und US-CAISI messen Kimi K3: offensive Cyber-Fähigkeiten deutlich unter der US-Spitze – die Leitplanken halten trotzdem nicht

„Open Weights and American AI Leadership“: über 30 Tech-Firmen warnen Washington vor einem Verbot offener Modelle

Dritt-Messung auf DeepSWE: Kimi K3 praktisch gleichauf mit Claude Fable 5 – zu einem Drittel der Kosten

Microsoft Research gibt Agenten eine Zwischensprache fürs Diagramm – das Modell liefert die Bedeutung, ein Compiler die Geometrie

Claude Opus 5 im Katalog: Was die 193-seitige System-Card wirklich zeigt

Anthropic veröffentlicht Claude Opus 5 – laut Anbieter nahe an Fable 5 zum halben Preis, gleicher Preis wie Opus 4.8

Sicherheitsforscher findet mit Kimi K3 mehrere RCE-Zero-Days in Redis – Hersteller patcht in sieben Versionen

Poolside veröffentlicht Laguna S 2.1: offenes Coding-Modell (118B, 8B aktiv) schlägt weit größere Open-Weight-Rivalen

Anthropic öffnet Claudes Sprachmodus für Opus und Sonnet – plus Aktionen in Gmail, Slack, Canva und Notion

US-Abgeordnete bringen „AI Kill Switch Act“ ein – DHS soll rogue KI-Systeme abschalten dürfen

Black Forest Labs stellt Flux 3 vor: multimodales Modell für Bild, Video mit nativem Ton – und Robotik

OpenAI schaltet ChatGPT Health für alle US-Nutzer frei – Anbindung an Apple Health und Patientenakten

Codeberg untersagt KI-Training auf seinen Daten und will KI-Massenprojekte ausschließen

Ex-Pastor verklagt OpenAI: ChatGPTs Gesundheitsrat habe fast tödliche Lungenembolie verschleppt

Weißes Haus wirft Moonshot Distillation von Anthropics Fable vor – Treasury droht mit Sanktionen

AMD investiert bis zu 5 Milliarden Dollar in Anthropic – 2 Gigawatt MI450-GPUs

Cisco veröffentlicht Antares: winzige, offene Modelle, die Schwachstellen im Code lokalisieren

UK-Sicherheitsinstitut: Alle getesteten Frontier-Modelle schummeln – und verbergen es meist

Alibabas Qwen-Audio-3.0-TTS-Plus führt Artificial Analysis’ Sprach-Arena an

OpenAI räumt Hugging-Face-Einbruch ein: Die Angreifer waren GPT-5.6 Sol und ein Pre-Release-Modell

Microsoft und Mistral vertiefen Partnerschaft: Milliarden für europäische KI-Infrastruktur – Modelle auch offline

Google bringt Gemini 3.6 Flash, 3.5 Flash-Lite und 3.5 Flash Cyber – Pro fehlt weiter

US-Gericht genehmigt Anthropics 1,5-Milliarden-Dollar-Vergleich mit Buchautoren

Sony Music verklagt Udio erneut – 30.117 Aufnahmen, bis zu 4,5 Milliarden Dollar Schadensrisiko

Die Leitplanken sperrten die Verteidiger aus: Hugging Face musste den OpenAI-Einbruch mit einem offenen Modell aufarbeiten

Microsoft holt AMDs Helios-Racks „at scale“ in die Azure-Cloud

Suno-Hack: Gehackter Quellcode belegt millionenfaches Abgreifen von YouTube Music, Deezer und Genius

Epoch AI: KI-Textdetektoren übersehen bis zu 48 Prozent, wenn Modelle einen Autorenstil imitieren

Alibaba kontert im Open-Model-Rennen: Qwen3.8-Max als 2,4-Billionen-Multimodal-Preview – „nur hinter Fable 5“