Authors

Name
Dr. jur. Urs Verweyen
Rechtsanwalt Attorney at Law (NY)
verweyen@vy-anwalt.de
+49 (30) 51 56 59 98-0

Neueste Artikel

Cross-Border Inheritance; European Certificate of Succession

30.06.2026 | Björn-Michael Lange

German Certificate of Inheritance for Heirs from the US Canada UK

30.06.2026 | Björn-Michael Lange

OLG Frankfurt: Sparkasse haftet gegenüber geschädigtem Bankkunden

30.06.2026 | Björn-Michael Lange

KI-Training als Text and Data Mining zulässig – GEMA ./. OpenAI

Urheberrecht Datenrecht IT-Recht

11.11.2025, letztes Update: 26.11.2025

Das Landgericht München hat am 11.11.2025 sein mit Spannung erwartetes Urteil in Sachen GEMA ./. OpenAI zur Zulässigkeit des Trainings von KI-Sprachmodellen (LL.M.s) mit urheberrechtlich geschützten Werken gefällt (Urt. v. 11.11.2025, Az. 42 O 14139/24 – GEMA ./. OpenAI, nrk). Mittlerweile liegt die vollständige Begründung des Urteils vor und kann hier abgerufen werden.

Kernaussagen des Urteils

Die Kernaussagen des Urteils des LG München sind (Rz. 191 ff.):

KI-Training ist Text and Data-Mining (TDM) und als solches keine urheberrechtlich relevante Nutzung. Es ist daher o.w. zulässig, Rz. 194 des Urteils: "Die automatisierte Auswertung selbst ist keine urheberrechtlich relevante Handlung (BT-Drs. 18/12329, 40, zu § 60d a.F.). Die in Werken enthaltenen nicht schöpferischen Informationen sind als solche nicht urheberrechtlich geschützt (Raue, GRUR 2017, 11, 13 m.w.N.), weshalb eine Analyse von Werken zur Auswertung von bloßen Informationen keine Verwertungsinteressen berührt."
Die Anfertigung von Vervielfältigungen urheberrechtlich geschützter Werke zum Zwecke des KI-Training bzw. des Text and Data-Mining ist von der TDM-Schranke (§ 44b UrhG / Art. 2 Abs. 2 der europ. DSM-RiL) gedeckt und daher ebenfalls zulässig, Rz. 193 ff.: "Sprachmodelle wie die streitgegenständlichen Modelle unterfallen grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus in Phase 1 (s.o.), …"
Lediglich die vom LG München festgestellten bzw. vermuteten "Memorisierungen" der streitgegenständlichen Liedtexte (u.a. "Atemlos ..." und "Männer") in den streitgegenständlichen Sprachmodellen 4 und 4o von OpenAI sind nach Ansicht des Gerichts als Vervielfältigungen i.S.v. § 16 UrhG, Art. 2 InfoSocRiL unzulässig, Rz. 167 ff., 193 ff.: "… nicht aber weitergehende Vervielfältigungen im Modell in Phase 2. Werden wie vorliegend beim Training in Phase 2 nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies kein Text und Data Mining dar. Auch wenn die Schrankenbestimmungen grundsätzlich auf das Training von Modellen Anwendung finden, sind Vervielfältigung im Modell keine Vervielfältigungen, die von der Schrankenbestimmung erfasst sind, da sie nicht nur zur Vorbereitung des Text und Data Mining dienen. …". Die dem zugrundeliegenden, sehr komplexen tatsächlich-technischen Feststellungen und rechtlichen Wertungen (Rz. 167 ff.) werden in den weiteren Instanzen wohl überprüft werden.
Die Memorisierungen führen auch dazu, dass OpenAI als Anbieter der Sprachmodelle auch für entsprechenden, rechtsverletzenden Output verantwortlich sein soll (Rz. 234 ff.). Ob diese auch dann gilt, wenn rechtsverletzende Inhalte ohne (vorherige) Memorisierung erzeugt werden, bleibt offen. Das Urteil sagt auch nichts dazu, ob Nutzer_innen ebenfalls für rechtsverletzenden Output haften (davon ist aber nach allg. Grundsätzen jedenfalls bei einer (Weiter-) Nutzung rechtsverletzenden Outputs z.B. durch öffentliche Wiedergabe des Outputs auszugehen).

Bedeutung des Urteils des LG München

Die Urteilsbegründung bestätigt damit, dass es sich eher um einen Pyrrhussieg der GEMA handelt, denn wie schon der Pressemeldung des LG München vom 11.11.2025 zu entnehmen war, sieht auch das LG München das Training von KI-Sprachmodellen (LL.M.s) als Text und Data-Mining und daher für grundsätzlich (und vergütungsfrei) zulässig an. Die Unzulässigkeit im konkreten Fall folgt allein aus der vom LG München festgestellten "Memorisierung" der streitgegenständlichen Liedtexte (u.a. "Atemlos …" und "Männer") in den streitgegenständlichen, bereits veralteten Sprachmodellen (LL.M.s) 4 und 4o von OpenAI (vgl. auch die Erörterung von Prof. Dr. Linda Kuschel u.a. hier).

Das Urteil des LG München liegt damit weitgehend auf einer Linie mit dem Urteil des LG Hamburg vom 27.09.2024, Az. 310 O 227/23, nrk/Berufung wurde eingelegt) in dem Verfahren eines Stockfoto-Händlers gegen den gemeinnützigen LAION e.V. und Urteilen aus den USA (z.B. in Sachen Antrophic; hier wurde nachfolgend ein Vergleich abgeschlossen) und UK (z.B. in Sachen Getty ./. Stability AI), wonach das Trainieren von LL.M.s (Large Language Models / KI-Sprachmodellen) als Text and Data Mining i.S.d. Art. 2 Nr. 2 der europäischen DSM-Richtlinie bzw. als "fair use" (§ 107 US Copyright Code) grundsätzlich zulässig ist.

Das Urteil ist nicht rechtskräftig, eine Überprüfung der tatsächlichen Feststellungen und Rechtsfragen durch das OLG München (Berufung) und (nur der Rechtsfragen) durch den Bundesgerichtshof (Revision) ist zu erwarten. Da Grundlage der Entscheidung die TDM-Schranke der europäischen DSM-Richtlinie (vgl. Art. 2 Abs. 2 DSM-RiL) ist, ist auch eine Vorlage an den Europäischen Gerichtshof EuGH nicht ausgeschlossen. Kritisch erscheinen uns insoweit v.a.

die tatsächliche Feststellung des LG München, dass Vervilefältigungen der Ausgangswerke in dem Sprachmodell vorliegen sollen, dass also tatsächlich eine Memorisierung stattfindet (das LG München hat dies in freier Beweiswürdigung bejaht, weil die Liedtexte unstreitig im Trainingsdatensatz enthalten waren und weil sie durch "sehr einfach gehaltene Prompts" nahezu identisch ausgegeben werden konnten, Rz. 168 ff.), und
die daraus abgeleitete rechtliche Bewertung, dass der Output des Sprachmodells von Open AI als Betreiber des Modells öffentlich zugänglich gemacht wird (i.S.v. § 19a UrhG), und OpenAI daher für den Output des Modells verantwortlich ist (Rz. 239 ff.).

In prozessualer Hinsicht gilt:

Das Urteil bindet nur die Parteien des Verfahrens, also die GEMA und OpenAI,
es betrifft nur die (veralteten) Sprachmodelle 4 und 4o (OpenAI hat soeben Modell 5.1 freigegeben), und
es betrifft nur nur die streitgegenständlichen Liedtexte ("Atemlos" von Kristina Bach, "36 Grad" von Thomas Eckart, Inga Humpe, Peter Plate und Ulf Leo Sommer, "Bochum" und "Männer" von Herbert Grönemeyer, "Über den Wolken" von Reinhard Mey, "Junge" von Jan Vetter sowie "Es schneit", "In der Weihnachtsbäckerei" und "Wie schön, dass du geboren bist" von Rolf Zuckowski).

Aus dem Urteil

Die wichtigsten Passagen aus der Urteilsbegründung (ab Rz. 191 ff. des Urteils) lauten (Hervorhebung hier):

"Sprachmodelle wie die streitgegenständlichen Modelle unterfallen grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus in Phase 1 (s.o.), nicht aber weitergehende Vervielfältigungen im Modell in Phase 2. ...

aa. Nach der Legaldefinition in § 44b Abs. 1 UrhG, die weitgehend Art. 2 Abs. 2 DSM-RL entspricht, ist „Text und Data Mining […] die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.“ Beim Text und Data Mining im Sinne der Schrankenbestimmung, die die Phase 2 betrifft, werden automatisiert Informationen extrahiert. Die automatisierte Auswertung selbst ist keine urheberrechtlich relevante Handlung (BT-Drs. 18/12329, 40, zu § 60d a.F.). Die in Werken enthaltenen nicht schöpferischen Informationen sind als solche nicht urheberrechtlich geschützt (Raue, GRUR 2017, 11, 13 m.w.N.), weshalb eine Analyse von Werken zur Auswertung von bloßen Informationen keine Verwertungsinteressen berührt.

Für das Text und Data Mining sind allerdings mitunter vorbereitende Maßnahmen vonnöten, die in Verwertungsrechte eingreifen können, wie etwa die Vervielfältigung eines Werks durch seine Überführung in ein anderes (digitales) Format oder Speicherungen im Arbeitsspeicher. Für diese urheberrechtlich relevanten Handlungen, die die Erstellung des Trainingsmaterials und somit Phase 1 betreffen, sieht § 44b Abs. 2 S. 1 UrhG grundsätzlich die Zulässigkeit von Vervielfältigungen vor. Hintergrund hierfür ist der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt werden und damit die Verwertungsinteressen des Urhebers am Werk nicht beeinträchtigen (Schack, ZUM 2016, 266, 269). Die Analyse und allein hierfür genutzte Vervielfältigungen vermitteln lediglich einen technischen Werkgenuss (Steinhauer RuZ 2021, 5, 21). Da diese für das Text und Data Mining rein vorbereitenden Handlungen kein Verwertungsinteresse berühren, sieht das Gesetz keine Vergütungspflicht gegenüber dem Urheber vor (Spindler/Schuster/Kaesling/Pesch, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 8).

bb. Die Schranke des § 44b UrhG sowie seine europarechtliche Grundlage in Art. 4 DSM-RL finden auf Text und Data Mining beim Training Künstlicher Intelligenz Anwendung (zum Meinungsstand im Schrifttum vgl. Spindler/Schuster/Kaesling/Pesch, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 17 Fn. 65). Vervielfältigungshandlungen zur Vorbereitung des Trainingskorpus sind davon erfasst.

(1) Wie die Beklagten zutreffend unter Bezugnahme auf die Mitteilung der Kommission „Künstliche Intelligenz für Europa“ vom 25.04.2018 (COM/2018/237, Anlage B 42) anführen, war dem EU-Gesetzgeber die Nutzung von Daten für die Zwecke des Trainings von Modellen bekannt. Selbst wenn dem nicht so gewesen sein sollte, erstreckt sich der Anwendungsbereich des § 44b UrhG sowie Art. 4 DSM-RL auf die moderne Technologie. Ausweislich der Erwägungsgründe der DSM-RL sollen die Schrankenbestimmungen des Text und Data Mining gerade neue Technologie fördern: laut Erwägungsgrund 18 Abs. 1 S. 1 DSM-RL sollen Verfahren des Text und Data Mining der Entwicklung neuer Anwendungen oder Technologien dienen. Um dies zu ermöglichen, müssen nach Erwägungsgrund 3 S. 2 DSM-RL die „einschlägigen Rechtsvorschriften […] zukunftstauglich sein, damit die technologische Entwicklung nicht behindert wird.“

In diesem Sinne hat der Unionsgerichtshof bereits im Hinblick auf die Schranke für Vervielfältigungshandlungen nach Art. 5 Abs. 1 InfoSoc-RL darauf hingewiesen, …

In der Gesetzesbegründung zu § 44b und §§ 60a ff UrhG hat dann auch der deutsche Gesetzgeber „das maschinelle Lernen als Basis-Technologie für Künstliche Intelligenz“ im Rahmen des Anwendungsbereichs explizit aufgeführt (BT-Drs. 19/27426, 60).

(2) Dem Anwendungsbereich des § 44b UrhG unterfallen somit Vervielfältigungshandlungen zur Vorbereitung des Trainingskorpus von Modellen. …"

Die GEMA und Lobbyverbände der Urheber_innen feiern das Urteil des LG München als großen Sieg gegen OpenAI und generell gegen die Entwickler und Anbieter Künstlicher Intelligenz-Systeme, denen gerne ein "Raubzug" am geistigen Eigentum der Urheber_innen vorgeworfen wird. Das Urteil gibt das allerdings nicht her. Denn demnach hängt die Entscheidung gegen OpenAI allein daran, dass das Gericht festgestellt haben will, dass in den bereits veralteten Sprachmodellen 4 und 4o von OpenAI die streitgegenständlichen Liedtexte vollständig enthalten waren, also memorisiert wurden, und nicht (nur) für die Datenanalyse genutzt wurden. Eins solche Memorisierung, wenn sie denn tatsächlich stattgefunden hat, ist aber gar nicht gewollt, sondern ein Bug, der von den Modellanbietern beseitigt wird. Das eigentliche Training der Modelle ist als Text- und Data-Mining auch nach Ansicht des LG München hingegen ausdrücklich (und vergütungsfrei) zulässig. Spannend ist daher v.a. ob die tatsächlichen Feststellungen des Landgerichts München und seine rechtliche Bewertung von Memorisierung in den nächsten Instanzen Bestand haben werden.
Dr. jur. Urs Verweyen, LL.M. (NYU) | Rechtsanwalt, Partner

Authors

Name
Dr. jur. Urs Verweyen
Rechtsanwalt Attorney at Law (NY)
verweyen@vy-anwalt.de
+49 (30) 51 56 59 98-0

Neueste Artikel

Cross-Border Inheritance; European Certificate of Succession

30.06.2026 | Björn-Michael Lange

German Certificate of Inheritance for Heirs from the US Canada UK

30.06.2026 | Björn-Michael Lange

OLG Frankfurt: Sparkasse haftet gegenüber geschädigtem Bankkunden

30.06.2026 | Björn-Michael Lange

KI-Training als Text and Data Mining zulässig – GEMA ./. OpenAI

Urheberrecht Datenrecht IT-Recht

11.11.2025, letztes Update: 26.11.2025

Kernaussagen des Urteils

Die Kernaussagen des Urteils des LG München sind (Rz. 191 ff.):

KI-Training ist Text and Data-Mining (TDM) und als solches keine urheberrechtlich relevante Nutzung. Es ist daher o.w. zulässig, Rz. 194 des Urteils: "Die automatisierte Auswertung selbst ist keine urheberrechtlich relevante Handlung (BT-Drs. 18/12329, 40, zu § 60d a.F.). Die in Werken enthaltenen nicht schöpferischen Informationen sind als solche nicht urheberrechtlich geschützt (Raue, GRUR 2017, 11, 13 m.w.N.), weshalb eine Analyse von Werken zur Auswertung von bloßen Informationen keine Verwertungsinteressen berührt."
Die Anfertigung von Vervielfältigungen urheberrechtlich geschützter Werke zum Zwecke des KI-Training bzw. des Text and Data-Mining ist von der TDM-Schranke (§ 44b UrhG / Art. 2 Abs. 2 der europ. DSM-RiL) gedeckt und daher ebenfalls zulässig, Rz. 193 ff.: "Sprachmodelle wie die streitgegenständlichen Modelle unterfallen grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus in Phase 1 (s.o.), …"
Lediglich die vom LG München festgestellten bzw. vermuteten "Memorisierungen" der streitgegenständlichen Liedtexte (u.a. "Atemlos ..." und "Männer") in den streitgegenständlichen Sprachmodellen 4 und 4o von OpenAI sind nach Ansicht des Gerichts als Vervielfältigungen i.S.v. § 16 UrhG, Art. 2 InfoSocRiL unzulässig, Rz. 167 ff., 193 ff.: "… nicht aber weitergehende Vervielfältigungen im Modell in Phase 2. Werden wie vorliegend beim Training in Phase 2 nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies kein Text und Data Mining dar. Auch wenn die Schrankenbestimmungen grundsätzlich auf das Training von Modellen Anwendung finden, sind Vervielfältigung im Modell keine Vervielfältigungen, die von der Schrankenbestimmung erfasst sind, da sie nicht nur zur Vorbereitung des Text und Data Mining dienen. …". Die dem zugrundeliegenden, sehr komplexen tatsächlich-technischen Feststellungen und rechtlichen Wertungen (Rz. 167 ff.) werden in den weiteren Instanzen wohl überprüft werden.
Die Memorisierungen führen auch dazu, dass OpenAI als Anbieter der Sprachmodelle auch für entsprechenden, rechtsverletzenden Output verantwortlich sein soll (Rz. 234 ff.). Ob diese auch dann gilt, wenn rechtsverletzende Inhalte ohne (vorherige) Memorisierung erzeugt werden, bleibt offen. Das Urteil sagt auch nichts dazu, ob Nutzer_innen ebenfalls für rechtsverletzenden Output haften (davon ist aber nach allg. Grundsätzen jedenfalls bei einer (Weiter-) Nutzung rechtsverletzenden Outputs z.B. durch öffentliche Wiedergabe des Outputs auszugehen).

Bedeutung des Urteils des LG München

die tatsächliche Feststellung des LG München, dass Vervilefältigungen der Ausgangswerke in dem Sprachmodell vorliegen sollen, dass also tatsächlich eine Memorisierung stattfindet (das LG München hat dies in freier Beweiswürdigung bejaht, weil die Liedtexte unstreitig im Trainingsdatensatz enthalten waren und weil sie durch "sehr einfach gehaltene Prompts" nahezu identisch ausgegeben werden konnten, Rz. 168 ff.), und
die daraus abgeleitete rechtliche Bewertung, dass der Output des Sprachmodells von Open AI als Betreiber des Modells öffentlich zugänglich gemacht wird (i.S.v. § 19a UrhG), und OpenAI daher für den Output des Modells verantwortlich ist (Rz. 239 ff.).

In prozessualer Hinsicht gilt:

Das Urteil bindet nur die Parteien des Verfahrens, also die GEMA und OpenAI,
es betrifft nur die (veralteten) Sprachmodelle 4 und 4o (OpenAI hat soeben Modell 5.1 freigegeben), und
es betrifft nur nur die streitgegenständlichen Liedtexte ("Atemlos" von Kristina Bach, "36 Grad" von Thomas Eckart, Inga Humpe, Peter Plate und Ulf Leo Sommer, "Bochum" und "Männer" von Herbert Grönemeyer, "Über den Wolken" von Reinhard Mey, "Junge" von Jan Vetter sowie "Es schneit", "In der Weihnachtsbäckerei" und "Wie schön, dass du geboren bist" von Rolf Zuckowski).

Aus dem Urteil

Die wichtigsten Passagen aus der Urteilsbegründung (ab Rz. 191 ff. des Urteils) lauten (Hervorhebung hier):

In diesem Sinne hat der Unionsgerichtshof bereits im Hinblick auf die Schranke für Vervielfältigungshandlungen nach Art. 5 Abs. 1 InfoSoc-RL darauf hingewiesen, …

(2) Dem Anwendungsbereich des § 44b UrhG unterfallen somit Vervielfältigungshandlungen zur Vorbereitung des Trainingskorpus von Modellen. …"

Die GEMA und Lobbyverbände der Urheber_innen feiern das Urteil des LG München als großen Sieg gegen OpenAI und generell gegen die Entwickler und Anbieter Künstlicher Intelligenz-Systeme, denen gerne ein "Raubzug" am geistigen Eigentum der Urheber_innen vorgeworfen wird. Das Urteil gibt das allerdings nicht her. Denn demnach hängt die Entscheidung gegen OpenAI allein daran, dass das Gericht festgestellt haben will, dass in den bereits veralteten Sprachmodellen 4 und 4o von OpenAI die streitgegenständlichen Liedtexte vollständig enthalten waren, also memorisiert wurden, und nicht (nur) für die Datenanalyse genutzt wurden. Eins solche Memorisierung, wenn sie denn tatsächlich stattgefunden hat, ist aber gar nicht gewollt, sondern ein Bug, der von den Modellanbietern beseitigt wird. Das eigentliche Training der Modelle ist als Text- und Data-Mining auch nach Ansicht des LG München hingegen ausdrücklich (und vergütungsfrei) zulässig. Spannend ist daher v.a. ob die tatsächlichen Feststellungen des Landgerichts München und seine rechtliche Bewertung von Memorisierung in den nächsten Instanzen Bestand haben werden.
Dr. jur. Urs Verweyen, LL.M. (NYU) | Rechtsanwalt, Partner