27.08.2024

KI vs. Urheberrecht: ein Datensatz, zwei Jurisdiktionen, drei Schranken

Portrait von Dr. Lisa Käde
Dr. Lisa Käde Rechtsanwältin bei JBB Rechtsanwälte in Berlin, Wirtschaftsinformatikerin Künstliche Intelligenz, Urheberrecht, Open Source Software, IT, Legal Tech

Momentan sieht es ganz so aus, als würden die ersten Urteile zum Schutz für Rechtsinhaber:innen vor Vervielfältigungen ihrer Werke für KI-Training zum Datensatz LAION-5B ergehen – vielleicht sogar in Deutschland. Grund genug, einmal näher hinzuschauen:

Prozessuales Rennen

Schon seit einer Weile sind in den USA die ersten Gerichtsverfahren im Gange, die sich mit der Verwendung urheberrechtlich geschützter Werke für das Training von insbesondere generativen KI-Modellen befassen (siehe „Map of all 29 copyright lawsuits v. AI“, 25 August 2024). Eigentlich war es nur eine Frage der Zeit, bis auch in Europa die ersten Klagen mit KI-Bezug anhängig werden.

In Deutschland klagte jüngst ein Fotoproduzent gegen den Hersteller von Trainingsdatensätzen LAION e.V., der unter anderem den Datensatz LAION-5B anbietet, der auch für das Training der Stable Diffusion-KI-Modelle zum Einsatz kommt. Den Verkündungstermin hat das mit der Sache befasste LG Hamburg für den 27. September 2024 vorgesehen.

Urheberrechtlicher Ansatz beim Datensatz LAION-5B

Der Datensatz LAION-5B ist auch einer der Gegenstände des US-Verfahrens Andersen et al. v. Stability AI Ltd. Et al. Beklagte in dem Verfahren sind neben Stability AI auch andere Anbieter großer generativer KI-Modelle wie z.B. Midjourney. Der deutsche LAION e.V. ist allerdings nicht Partei des Verfahrens. Spannend wird sein zu beobachten, wie die unterschiedlichen Gerichte mit der doch ähnlich gelagerten Situation der Verwendung geschützter Daten für das KI-Training umgehen: Während in Deutschland bzw. der EU die Text und Data Mining-Schranke des § 44b UrhG bzw. Art. 4 DSM Richtlinie (EU) 2019/790 zum ersten Mal auf die Probe gestellt wird – insbesondere deren Möglichkeit, einen Vorbehalt gegen Vervielfältigungen geschützter Werke zu erklären – dürfte sich in den USA das Hauptaugenmerk auf die Fair Use Doctrine richten. In Europa können bestimmte Forschungsorganisationen sich darüber hinaus auch auf § 60d UrhG berufen, gegen den kein Vorbehalt erklärt werden kann.

Vorfragen im US-Verfahren

Im US-Verfahren Andersen et al. v. Stability AI Ltd. Et al. wurde im August dieses Jahres zunächst über erste Motions to Dismiss entschieden (Sookman, „AI models and copyright infringement“, 19 August 2024). Teilweise wurden Anträge der Kläger zugelassen, sodass das Verfahren weitergeht.

Zentrale Fragen im deutschen Verfahren

Das deutsche Verfahren gegen LAION e.V. bietet Anlass, zentrale urheberrechtliche Weichenstellungen genauer anzuschauen. In meinem Aufsatz im Septemberheft CR  (Käde, CR 9/2024, CR0070551) gebe ich einen Überblick über einige der grundlegenden Fragen des Verfahrens sowie über für die weitere Analyse relevante technische Hintergründe etwa der Möglichkeiten, einen Vorbehalt gegen das Text und Data Mining maschinenlesbar zu gestalten.

Schlüssel der Maschinenlesbarkeit

Mit dem Kriterium der Maschinenlesbarkeit, das wesentlich für die Wirksamkeit eines gemäß § 44b Absatz 3 UrhG erklärten Vorbehaltes ist, muss sich das LG Hamburg wohl schwerpunktmäßig befassen – denn es geht in dem Verfahren unter anderem auch um einen Vorbehalt, der in Nutzungsbedingungen auf einer Webseite erklärt wurde. Das Kriterium der Maschinenlesbarkeit und deren Umsetzung ist von erheblicher Relevanz sowohl für Kunstschaffende als auch für alle, die geschützte Werke für das KI-Training nutzen möchten, sodass hier die Balance zwischen einfacher Umsetzbarkeit für Rechtsinhaber:innen und effizienter Gestaltung für Crawling- bzw. Scraping-Programme zu finden ist.

 

Zurück