Schwerpunkte
Team
News
+49 (30) 51 56 59 98 - 0Kontakt
Schwerpunkte
Team
News
VY AnwaltVY Anwalt
VY AnwaltVY Anwalt

Footer

BerlinKoblenzFlensburgNürnberg
StellenangeboteVergütungMandatsbedingungenDatenschutzImpressum
Authors
  • Dr. jur. Urs Verweyen, LL.M. (NYU)
    Name
    Dr. jur. Urs Verweyen
    Rechtsanwalt Attorney at Law (NY)
    verweyen@vy-anwalt.de
    +49 (30) 51 56 59 98-0
Neueste Artikel
Die wachsenden Kundenprobleme bei Trade Republic - Anwalt hilft
12.11.2025 | Björn-Michael Lange
BaFin warnt vor WhatsApp-Gruppen: Identitätsmissbrauch
12.11.2025 | Björn-Michael Lange
Researchers: Legal Guidance for Scientists Leaving the U.S.
12.11.2025 | Björn-Michael Lange

KI-Training als Text and Data Mining zulässig – GEMA ./. OpenAI

KI-Training als Text and Data Mining zulässig – GEMA ./. OpenAI
UrheberrechtDatenrechtIT-Recht
11.11.2025, letztes Update: 12.11.2025

Das Landgericht München hat am 11.11.2025 sein mit Spannung erwartetes Urteil in Sachen GEMA ./. OpenAI zur Zulässigkiet des Trainings von KI-Sprachmodellen (LL.M.s) mit urheberrechtlich geschützten Werken gefällt (Urt. v. 11.11.2025, Az. 42 O 14139/24 – GEMA ./. OpenAI, nrk). Mittlerweile liegt die vollständige Begründung des Urteils vor und kann hier abgerufen werden – Kernaussagen des Urteils (Rz. 191 ff.):

  1. KI-Training ist Text and Data-Mining (TDM) und als solches keine urheberrechtlich relevante Nutzung. Es ist daher o.w. zulässig, Rz. 194 des Urteils: "Die automatisierte Auswertung selbst ist keine urheberrechtlich relevante Handlung (BT-Drs. 18/12329, 40, zu § 60d a.F.). Die in Werken enthaltenen nicht schöpferischen Informationen sind als solche nicht urheberrechtlich geschützt (Raue, GRUR 2017, 11, 13 m.w.N.), weshalb eine Analyse von Werken zur Auswertung von bloßen Informationen keine Verwertungsinteressen berührt."
  2. Die Anfertigung von Vervielfältigungen urheberrechtlich geschützter Werke zum Zwecke des KI-Training bzw. des Text and Data-Mining ist von der TDM-Schranke (§ 44b UrhG / Art. 2 Abs. 2 der europ. DSM-RiL) gedeckt und daher ebenfalls zulässig, Rz. 193 ff.: "Sprachmodelle wie die streitgegenständlichen Modelle unterfallen grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus in Phase 1 (s.o.), …"
  3. Lediglich die vom LG München festgestellten "Memorisierungen" der streitgegenständlichen Liedtexte (u.a. "Atemlos ..." und "Männer") in den streitgegenständlichen Sprachmodellen 4 und 4o von OpenAI ist unzulässig, Rz. 193 ff.: "… nicht aber weitergehende Vervielfältigungen im Modell in Phase 2. Werden wie vorliegend beim Training in Phase 2 nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies kein Text und Data Mining dar. Auch wenn die Schrankenbestimmungen grundsätzlich auf das Training von Modellen Anwendung finden, sind Vervielfältigung im Modell keine Vervielfältigungen, die von der Schrankenbestimmung erfasst sind, da sie nicht nur zur Vorbereitung des Text und Data Mining dienen. …".
  4. Die festgestellte Memorisierung führt auch dazu, dass OpenAI als Anbieter der Sprachmodelle auch für rechtsverletzenden Output verantwortlich ist (Rz. 234 ff.). Ob diese auch dann gilt, wenn rechtsverletzende Inhalte ohne (vorherige) Memorisierung erzeugt werden, bleibt offen. Das Urteil sagt auch nichts dazu, ob Nutzer_innen ebenfalls für rechtsverletzenden Output haften (davon ist aber nach allg. Grundsätzen jedenfalls bei einer (Weiter-) Nutzung rechtsverletzenden Outputs z.B. durch öffentliche Wiedergabe des Outputs auszugehen).
Wenn Sie zum Urteil des LG München oder allgemein zu KI und Urheberrecht Fragen haben, sprechen Sie uns gerne an!
Vielen Dank!
Ihre Anfrage wurde an uns übermittelt. Wir werden uns umgehend bei Ihnen melden. Mehr über die aktuellen Entwicklungen erfahren Sie in unserem News.
Oh, Entschuldigung.
Es scheint ein Fehler bei der Verarbeitung passiert zu sein. Wir beheben dies schnellstmöglich. Sie können sich natürlich auch telefonisch mit uns in Verbindung setzen. Die Telefonnummer sehen Sie oben rechts auf der Internetseite.


Die Urteilsbegründung bestätigt damit, dass es sich eher um einen Pyrrhussieg der GEMA handelt, denn wie schon der Pressemeldung des LG München vom 11.11.2025 zu entnehmen war, sieht auch das LG München das Training von KI-Sprachmodellen (LL.M.s) als Text und Data-Mining und daher für grundsätzlich (und vergütungsfrei) zulässig an. Die Unzulässigkeit im konkreten Fall folgt allein aus der vom LG München festgestellten "Memorisierung" der streitgegenständlichen Liedtexte (u.a. "Atemlos …" und "Männer") in den streitgegenständlichen, bereits veralteten Sprachmodellen (LL.M.s) 4 und 4o von OpenAI.

Das Urteil des LG München liegt damit weitgehend auf einer Linie mit dem Urteil des LG Hamburg vom 27.09.2024, Az. 310 O 227/23, nrk/Berufung wurde eingelegt) in dem Verfahren eines Stockfoto-Händlers gegen den gemeinnützigen LAION e.V. und Urteilen aus den USA (z.B. in Sachen Antrophic; hier wurde nachfolgend ein Vergleich abgeschlossen) und UK (z.B. in Sachen Getty ./. Stability AI), wonach das Trainieren von LL.M.s (Large Language Models / KI-Sprachmodellen) als Text and Data Mining i.S.d. Art. 2 Nr. 2 der europäischen DSM-Richtlinie bzw. als "fair use" (§ 107 US Copyright Code) grundsätzlich zulässig ist.

Die Urteil des LG München ist nicht rechtskräftig und es ist davon auszugehen, dass Berufung eingelegt wird und daran im Anschluss auch die Revision zum Bundesgerichtshof BGH. Da Grundlage der Entscheidung letztlich die TDM-Schranke der europäischen DSM-Richtlinie (vgl. Art. 2 Abs. 2 DSM-RiL) ist, ist auch eine Vorlage an den Europäischen Gerichtshof EuGH nicht auszuschließen und wäre u.E. zur weiteren Klärung der Rechtslage zu begrüßen.

Wenn Sie zum Urteil des LG München oder allgemein zu KI und Urheberrecht Fragen haben, sprechen Sie uns gerne an!
Vielen Dank!
Ihre Anfrage wurde an uns übermittelt. Wir werden uns umgehend bei Ihnen melden. Mehr über die aktuellen Entwicklungen erfahren Sie in unserem News.
Oh, Entschuldigung.
Es scheint ein Fehler bei der Verarbeitung passiert zu sein. Wir beheben dies schnellstmöglich. Sie können sich natürlich auch telefonisch mit uns in Verbindung setzen. Die Telefonnummer sehen Sie oben rechts auf der Internetseite.


Die wichtigsten Passagen aus der Urteilsbegründung (ab Rz. 191 ff. des Urteils) lauten (Hervorhebung hier):

"Sprachmodelle wie die streitgegenständlichen Modelle unterfallen grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus in Phase 1 (s.o.), nicht aber weitergehende Vervielfältigungen im Modell in Phase 2. ...

aa. Nach der Legaldefinition in § 44b Abs. 1 UrhG, die weitgehend Art. 2 Abs. 2 DSM-RL entspricht, ist „Text und Data Mining […] die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.“ Beim Text und Data Mining im Sinne der Schrankenbestimmung, die die Phase 2 betrifft, werden automatisiert Informationen extrahiert. Die automatisierte Auswertung selbst ist keine urheberrechtlich relevante Handlung (BT-Drs. 18/12329, 40, zu § 60d a.F.). Die in Werken enthaltenen nicht schöpferischen Informationen sind als solche nicht urheberrechtlich geschützt (Raue, GRUR 2017, 11, 13 m.w.N.), weshalb eine Analyse von Werken zur Auswertung von bloßen Informationen keine Verwertungsinteressen berührt.

Für das Text und Data Mining sind allerdings mitunter vorbereitende Maßnahmen vonnöten, die in Verwertungsrechte eingreifen können, wie etwa die Vervielfältigung eines Werks durch seine Überführung in ein anderes (digitales) Format oder Speicherungen im Arbeitsspeicher. Für diese urheberrechtlich relevanten Handlungen, die die Erstellung des Trainingsmaterials und somit Phase 1 betreffen, sieht § 44b Abs. 2 S. 1 UrhG grundsätzlich die Zulässigkeit von Vervielfältigungen vor. Hintergrund hierfür ist der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt werden und damit die Verwertungsinteressen des Urhebers am Werk nicht beeinträchtigen (Schack, ZUM 2016, 266, 269). Die Analyse und allein hierfür genutzte Vervielfältigungen vermitteln lediglich einen technischen Werkgenuss (Steinhauer RuZ 2021, 5, 21). Da diese für das Text und Data Mining rein vorbereitenden Handlungen kein Verwertungsinteresse berühren, sieht das Gesetz keine Vergütungspflicht gegenüber dem Urheber vor (Spindler/Schuster/Kaesling/Pesch, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 8).

bb. Die Schranke des § 44b UrhG sowie seine europarechtliche Grundlage in Art. 4 DSM-RL finden auf Text und Data Mining beim Training Künstlicher Intelligenz Anwendung (zum Meinungsstand im Schrifttum vgl. Spindler/Schuster/Kaesling/Pesch, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 17 Fn. 65). Vervielfältigungshandlungen zur Vorbereitung des Trainingskorpus sind davon erfasst.

(1) Wie die Beklagten zutreffend unter Bezugnahme auf die Mitteilung der Kommission „Künstliche Intelligenz für Europa“ vom 25.04.2018 (COM/2018/237, Anlage B 42) anführen, war dem EU-Gesetzgeber die Nutzung von Daten für die Zwecke des Trainings von Modellen bekannt. Selbst wenn dem nicht so gewesen sein sollte, erstreckt sich der Anwendungsbereich des § 44b UrhG sowie Art. 4 DSM-RL auf die moderne Technologie. Ausweislich der Erwägungsgründe der DSM-RL sollen die Schrankenbestimmungen des Text und Data Mining gerade neue Technologie fördern: laut Erwägungsgrund 18 Abs. 1 S. 1 DSM-RL sollen Verfahren des Text und Data Mining der Entwicklung neuer Anwendungen oder Technologien dienen. Um dies zu ermöglichen, müssen nach Erwägungsgrund 3 S. 2 DSM-RL die „einschlägigen Rechtsvorschriften […] zukunftstauglich sein, damit die technologische Entwicklung nicht behindert wird.“

In diesem Sinne hat der Unionsgerichtshof bereits im Hinblick auf die Schranke für Vervielfältigungshandlungen nach Art. 5 Abs. 1 InfoSoc-RL darauf hingewiesen, …

In der Gesetzesbegründung zu § 44b und §§ 60a ff UrhG hat dann auch der deutsche Gesetzgeber „das maschinelle Lernen als Basis-Technologie für Künstliche Intelligenz“ im Rahmen des Anwendungsbereichs explizit aufgeführt (BT-Drs. 19/27426, 60).

(2) Dem Anwendungsbereich des § 44b UrhG unterfallen somit Vervielfältigungshandlungen zur Vorbereitung des Trainingskorpus von Modellen. …"

Die GEMA und Lobbyverbände der Urheber_innen feiern das Urteil des LG München als großen Sieg gegen OpenAI und generell gegen die Entwickler und Anbieter Künstlicher Intelligenz-Systeme, denen gerne ein "Raubzug" am geistigen Eigentum der Urheber_innen vorgeworfen wird. Das Urteil gibt das allerdings nicht her. Denn demnach hängt die Entscheidung gegen OpenAI allein daran, dass das Gericht festgestellt hat, dass in den bereits veralteten Sprachmodellen 4 und 4o von OpenAI die streitgegenständlichen Liedtexte vollständig enthalten waren und nicht (nur) für die Datenanalyse genutzt wurden. Diese Memorisierung ist aber gar nicht gewollt, es handelt sich laut OpenAI um einen Bug, der von den Modellanbietern beseitigt wird. Das eigentliche Training der Modelle ist als Text- und Data-Mining auch nach Ansicht des LG München hingegen ausdrücklich (und vergütungsfrei) zulässig. Spannend wird zu sehen sein, ob die tatsächlichen Feststellungen des Landgerichts München zur Memorierung in der nächsten Instanz, also in der Berufung vor dem OLG München, Bestand haben werden. Die Rechtsfragen, die dann ggf. noch vom Bundesgerichtshof in einer Revision und ggf. von dem Europäischen Gerichtshof im Rahmen eines Vorlageverfahrens zu klären wären, liegen hingegen auf einer Linie mit der bisherigen Rechtsprechung zum KI-Training und entsprechen den gesetzlichen Vorgaben.

Dr. jur. Urs Verweyen, LL.M. (NYU)
Dr. jur. Urs Verweyen, LL.M. (NYU) | Rechtsanwalt, Partner