Die Kläger – vertreten durch die Kanzlei Platkin LLP des früheren New-Jersey-Generalstaatsanwalts Matthew J. Platkin – werfen OpenAI und Microsoft vor, „systematisch und vorsätzlich“ hunderttausende urheberrechtlich geschützte Nachrichtenartikel kopiert zu haben, um damit ihre kommerziellen KI-Produkte ChatGPT und Microsoft Copilot zu trainieren. Die Modelle könnten Inhalte teils nahezu wortgetreu wiedergeben. Die Verlage argumentieren, die Unternehmen hätten damit „Hunderte Milliarden US-Dollar“ an Marktwert geschaffen, während „nicht ein Cent“ an die Urheber geflossen sei. (Vorwürfe der Klageschrift, gerichtlich nicht entschieden.)
Neben der Urheberrechtsverletzung stützt sich die Klage auf den Digital Millennium Copyright Act (DMCA): OpenAI habe gezielt „Copyright Management Information“ entfernt – also Autorenangaben, Copyright-Vermerke und Nutzungsbedingungen. Gefordert werden Schadensersatz, ein Ende der behaupteten Verstöße sowie die Vernichtung der auf den Inhalten trainierten KI-Modelle.
Einordnung: Die Klage reiht sich in eine wachsende Zahl von Verfahren um KI-Trainingsdaten ein (prominent NYT ./. OpenAI), unterscheidet sich aber durch die schiere Zahl kleiner, finanz- und rechtsschwacher Lokalverlage, die sich zur „Local Press Copyright Alliance“ zusammengeschlossen haben. Für die Branche bleibt damit offen, ob das Training auf öffentlich erreichbaren, aber geschützten Texten als Fair Use durchgeht – die Antwort darauf entscheidet mit über Verfügbarkeit, Lizenzkosten und Trainingspraxis künftiger Modelle.