Recht

Recht, Datenschutz & Regulierung

Sobald KI über das Ausprobieren hinausgeht, kommen rechtliche Fragen: Dürfen Anbieter auf geschütztem Material trainieren? Wem gehört der erzeugte Text? Was schreibt der EU AI Act vor, und wer haftet für Fehler? Diese Seite ordnet den Stand Mitte 2026 ein – mit dem ehrlichen Hinweis, dass vieles vor Gericht und im Gesetzgebungsverfahren noch offen ist. Sie ersetzt keine Rechtsberatung.

5 Min. Lesezeit
6 Abschnitte
8 Quellen
Stand: 16. Juni 2026

Urheberrecht an Trainingsdaten

Dürfen Modelle auf geschützten Texten und Bildern trainiert werden? In der EU regelt das die Schranke für Text und Data Mining: Für die wissenschaftliche Forschung ist TDM weitgehend erlaubt (in Deutschland § 60d UrhG), für kommerzielle Zwecke nur, solange die Rechteinhaber keinen Vorbehalt erklärt haben (§ 44b UrhG). Dieser Opt-out wirkt bei online zugänglichen Werken aber nur, wenn er maschinenlesbar erfolgt – wie genau, ist technisch und rechtlich noch unscharf.

Der EU AI Act verschärft die Pflichten der Anbieter: Seit dem 2. August 2025 müssen Anbieter universeller KI-Modelle (GPAI) das EU-Urheberrecht einschließlich des Rechtevorbehalts einhalten und eine „hinreichend detaillierte Zusammenfassung“ ihrer Trainingsinhalte veröffentlichen.

Vor Gericht ist die Lage uneinheitlich. In Deutschland entschied das LG München I im November 2025 erstmals grundsätzlich gegen OpenAI (Klage der GEMA): Memorisierte Songtexte seien als Kopien im Modell enthalten, Speicherung wie Ausgabe griffen ins Urheberrecht ein – das Urteil ist nicht rechtskräftig. Im LAION-Fall hielt das LG Hamburg 2024 das Erstellen eines Trainingsdatensatzes dagegen für von der Forschungsschranke gedeckt. In den USA werteten Gerichte das Training auf rechtmäßig erworbenen Werken teils als „fair use“, das Vorhalten von Raubkopien aber nicht – im Fall Bartz gegen Anthropic mündete das in einen Milliardenvergleich; das Verfahren der New York Times gegen OpenAI läuft weiter.

EU-TDM-Schranke: Forschung breit erlaubt (§ 60d); kommerziell nur ohne maschinenlesbaren Opt-out (§ 44b)
EU AI Act (seit 2.8.2025): GPAI: EU-Urheberrecht einhalten + „hinreichend detaillierte“ Trainingsdaten-Zusammenfassung
Stand der Gerichte: uneinheitlich & überwiegend offen (GEMA/OpenAI DE nicht rechtskräftig; NYT/OpenAI US läuft)

MerksatzOb das Training auf geschütztem Material zulässig ist, ist weltweit noch nicht abschließend geklärt – die ersten Grundsatzurteile fallen gerade.

Wem gehört der KI-Output?

Die spiegelbildliche Frage: Ist das von einer KI Erzeugte überhaupt urheberrechtlich geschützt – und wenn ja, für wen? Die kurze Antwort lautet meist: rein maschinell Erzeugtes ist nicht geschützt. In den USA hält das Copyright Office in seinem Bericht von Januar 2025 fest, dass eine menschliche Urheberschaft Voraussetzung ist; ein bloßer Prompt vermittelt nach heutigem Stand keine ausreichende schöpferische Kontrolle. Das Berufungsgericht bestätigte das Erfordernis menschlicher Urheberschaft, der Supreme Court lehnte die Annahme des Falls (Thaler) Anfang 2026 ab.

In Deutschland und der EU gilt nichts grundlegend anderes: Schutz setzt eine „eigene geistige Schöpfung“ eines Menschen voraus (§ 2 Abs. 2 UrhG). Rein automatisch Erzeugtes fällt regelmäßig heraus; entscheidend ist der menschliche schöpferische Beitrag – die kreative Auswahl, Anordnung und Bearbeitung. Wer also mit KI arbeitet und Ergebnisse schützen lassen will, sollte den eigenen gestalterischen Anteil dokumentieren statt sich auf den Prompt allein zu verlassen.

USA: menschliche Urheberschaft nötig; rein KI-generiert nicht schützbar; Prompt allein genügt nicht (US Copyright Office, 2025)
EU/Deutschland: „eigene geistige Schöpfung“ eines Menschen erforderlich (§ 2 Abs. 2 UrhG)
Praxis: schützbar ist der menschliche Anteil (Auswahl/Anordnung/Bearbeitung) – nicht das Roh-Ergebnis

MerksatzReiner KI-Output gehört in der Regel niemandem. Geschützt wird der menschliche schöpferische Beitrag – das bloße Eintippen eines Prompts zählt meist nicht.

Datenschutz & Vertraulichkeit

Eine belastbare Faustregel hilft hier mehr als jedes Kleingedruckte: Bezahlte API- und Enterprise-Tarife trainieren standardmäßig nicht auf deinen Eingaben – das haben OpenAI, Anthropic und Google jeweils bestätigt. Die kostenlosen Endkunden-Tarife weichen davon ab und trainieren oft standardmäßig mit, abschaltbar per Opt-out. Bezahlt heißt also nicht automatisch trainingsfrei, kostenlos nicht automatisch trainierend – entscheidend ist die Kombination aus Tarif und Einstellung, und Anbieter-Policies ändern sich laufend.

Dazu kommt die DSGVO, sobald personenbezogene Daten ins Spiel kommen. Solche Daten in einem Prompt brauchen eine eigene Rechtsgrundlage; der Europäische Datenschutzausschuss (EDSA) hält in seiner Stellungnahme von Ende 2024 fest, dass ein „berechtigtes Interesse“ die Verarbeitung tragen kann – nach einem dreistufigen Abwägungstest. Ein Modell gilt nur dann als anonym, wenn das Herauslösen von Personendaten „sehr unwahrscheinlich“ ist. Für den Berufseinsatz sind Geschäfts- und Enterprise-Tarife mit Auftragsverarbeitungsvertrag deshalb fast immer die richtige Wahl.

Bezahlte API / Enterprise: trainiert by default NICHT (OpenAI, Anthropic, Google je bestätigt)
Kostenlose Consumer-Tarife: trainieren oft standardmäßig – per Opt-out abschaltbar
DSGVO: personenbezogene Daten im Prompt brauchen Rechtsgrundlage; „berechtigtes Interesse“ nach Abwägung möglich (EDSA 2024)

MerksatzBezahlt ≠ automatisch trainingsfrei. Für sensible oder personenbezogene Daten gehören Geschäfts-/Enterprise-Tarife und ein Blick in die aktuelle Policy zur Pflicht.

Digitale Souveränität & Serverstandort

„Die Daten liegen in der EU“ – dieser Satz beruhigt, sagt über die tatsächliche Kontrolle aber wenig. Ein EU-Serverstandort ändert die Rechtslage, ist aber kein Synonym für Datenschutz oder Unabhängigkeit. Der heise-/c’t-Podcast c’t uplink, den wir als verlässliche Stimme einstufen, nennt „digitale Souveränität“ eine windelweiche Nullaussage, die persönliche (kann ich meine Daten kontrollieren?) und staatliche Souveränität (ist mein Land technologisch unabhängig?) gefährlich vermischt.

Zwei im selben Format zitierte Fachstimmen schärfen das: David Zellhöfer (HWR Berlin) hält fest, dass ohne eigene IT- und Datenkompetenz der Souveränitätsgewinn null ist – egal, ob der Dienstleister aus den USA oder aus Berlin kommt. Und Lilit Wittmann nennt die Cloud-Souveränitätsdebatte teils einen Kategorienfehler: Ein deutscher Hoster wehrt geopolitische Risiken nicht ab; er ändert das alltägliche Risikomodell, nicht die geopolitische Abhängigkeit.

Serverstandort EU: ändert die Rechtslage, ist aber kein Datenschutz-Siegel
Eigentlicher Hebel: eigene IT-/Datenkompetenz – ohne sie ist der Anbieter-Standort fast bedeutungslos

MerksatzEin EU-Serverstandort ist kein Datenschutz-Siegel. Souverän macht eigene IT-Kompetenz – nicht die Postanschrift des Rechenzentrums.

Open-weight-Modelle für eigene Infrastruktur →

Der EU AI Act: Risiko & Fristen

Die KI-Verordnung der EU verfolgt einen risikobasierten Ansatz. Anwendungen mit „unannehmbarem Risiko“ (etwa staatliches Social Scoring) sind verboten; Hochrisiko-Anwendungen – zum Beispiel KI in Personalauswahl, Kreditvergabe oder Medizin – unterliegen strengen Dokumentations-, Transparenz- und Aufsichtspflichten; alles darunter bleibt weitgehend frei. Verstöße können mit bis zu 35 Mio. € oder 7 % des weltweiten Jahresumsatzes geahndet werden.

Die Fristen sind gestaffelt – und in Bewegung. In Kraft seit dem 2. Februar 2025 sind die verbotenen Praktiken, seit dem 2. August 2025 die GPAI-Pflichten. Die Pflichten für Hochrisiko-Systeme sollten ursprünglich ab dem 2. August 2026 greifen; im Zuge des „Digital Omnibus“ haben sich die EU-Gesetzgeber Mitte 2026 aber auf eine Verschiebung verständigt (anwendungsbasierte Hochrisiko-Pflichten in Richtung Ende 2027). Diese Verschiebung war zum Stand Juni 2026 politisch geeinigt, aber noch nicht endgültig im Amtsblatt – vor verbindlichen Aussagen also den aktuellen Stand prüfen.

Praktisch relevant für fast alle ist Artikel 50: die Transparenzpflicht. Nutzer müssen erkennen können, dass sie mit einer KI interagieren, und KI-generierte oder -manipulierte Inhalte – insbesondere Deepfakes – sind klar zu kennzeichnen.

Risikostufen: verboten · hochrisiko (Pflichten) · Transparenzpflicht · minimal (frei)
Fristen: Verbote seit 2.2.2025 · GPAI seit 2.8.2025 · Hochrisiko ursprünglich 2.8.2026, per „Digital Omnibus“ in Verschiebung
Sanktionen: bis 35 Mio. € oder 7 % des weltweiten Jahresumsatzes

MerksatzFür Alltagsnutzung ändert sich wenig – heikel wird es, wo KI über Menschen entscheidet. Und: KI-Inhalte müssen gekennzeichnet werden.

Wie sich die Labore selbst regulieren (ASL/Preparedness) →

Wer haftet für den Output?

Eine eigene KI-Haftungsrichtlinie sollte die Lücke schließen, wurde aber zurückgezogen – die EU-Kommission nahm den Vorschlag im Oktober 2025 mangels Einigung von der Agenda. Damit gibt es keine harmonisierten, verschuldensbasierten KI-Haftungsregeln; es gilt das nationale Recht. Die überarbeitete Produkthaftungsrichtlinie erfasst immerhin Software und KI als „Produkt“ und begründet eine verschuldensunabhängige Haftung für fehlerhafte Produkte.

Für die Praxis bleibt die nüchterne Faustregel: Wer fehlerhaften oder rechtsverletzenden KI-Output verwendet oder veröffentlicht, haftet grundsätzlich selbst. Die Werkzeug-Eigenschaft der KI entlastet nicht automatisch – die Verantwortung für das Ergebnis bleibt beim Menschen, der es einsetzt.

MerksatzEs gibt keine eigene EU-KI-Haftung – es gilt das normale Recht. Für deinen veröffentlichten KI-Output haftest in aller Regel du, nicht das Modell.

Aktuelle Depeschen

LG München I gibt der GEMA gegen Suno recht: Speicherung im Modell ist Vervielfältigung →Bundesrichterin vermisst Belege für das „supply-chain risk“-Etikett des Pentagon gegen Anthropic →ChatGPT vor der VLOP-Einstufung: Die EU will das Digitale-Dienste-Gesetz im August auf OpenAI anwenden →Deutschland hat seine KI-Aufsicht: Das KI-MIG ist in Kraft, die Bundesnetzagentur übernimmt →