By Vincent M. Kästle und Tobias Wolfenstätter
Output
In der Ära der Künstlichen Intelligenz (KI) hat die rasante Entwicklung von Technologien wie maschinellem Lernen und neuronalen Netzwerken neue Horizonte eröffnet, aber gleichzeitig auch komplexe rechtliche Fragen aufgeworfen. Eine faszinierende Facette dieser Herausforderungen ist der immaterialgüterrechtliche Schutz von KI-generierten Erzeugnissen. Kaum jemand kann sich der „Kreativität“ dieser Systeme noch entziehen und nicht wenige konnten bereits mit Verblüffen feststellen, zu welchen Schöpfungen generative KI-Systeme wie ChatGPT, Midjourney und Co. fähig sind. Das führt unweigerlich zu rechtlichen Debatten über die Schutzwürdigkeit der generierten Erzeugnisse. Für KI-Erzeugnisse betrifft das vor allem das Urheberrecht bzw. Copyright.
Es ist nicht das erste Mal, dass ein technologischer Fortschritt das Urheberrecht vor Herausforderungen stellt. 1884 hatte beispielsweise der Supreme Court in Burrow-Giles Lithographic Co. v. Sarony[2] die Entscheidung über die Möglichkeit des Copyrights einer fotografischen Aufnahme zu treffen. Eine ähnliche folgenschwere Entscheidung wird die Frage über die Schutzfähigkeit von KI-Erzeugnissen sein. Erste Anzeichen deuten darauf hin, dass es eine differenzierende Praxis geben wird, die sich durch eine detaillierte Aufspaltung der zugrundeliegenden technischen Umsetzung und der Zusammenarbeit zwischen Mensch und KI auszeichnet. Das United States Copyright Office (USCO) lehnte zuletzt im Februar 2023 (teilweise) die Eintragungsfähigkeit des Comics „Zaraya Of The Dawn“ in das durch das USCO geführte Register ab.[3] Bereits 2022 wurde die Eintragung eines rein maschinell erstellen Werkes mit dem Titel „A Recent Entrance to Paradise“ verwehrt.[4] Im August 2023 urteilte der District Court of Columbia in gleicher Sache, dass das Copyright nur dann zu gewähren ist, wenn das Werk menschlichen Ursprungs ist.[5] Am 11. Dezember 2023 bestätigte das Copyright Review Board die Zurückweisungsentscheidung des USCO bezüglich des rein durch das Programm „RAGHAV“ geschaffene Bild mit dem Titel „Suryast“.[6]
Die Gewähr des Urheberrechts ist deswegen von besonderer Bedeutung, da es dem Urheber mannigfaltige Verwertungs- und Ausschließlichkeitsrechte einräumt. Im deutschen Recht finden sich diese im UrhG (z.B. das Recht der ersten Veröffentlichung gem. § 12 Abs. 1 UrhG); im amerikanischen Recht in ähnlicher Form u.a. in 17 U.S. Code § 106. Beiden Rechtsordnungen ist gemein, dass die Dauer der Rechte die Lebenszeit plus 70 Jahre überdauern kann (vgl. 17 U.S. Code § 302 bzw. § 64 UrhG).[7]
Dass KI dazu im Stande ist, Werke zu generieren, die denen menschlichen Ursprungs in „Kreativität“, Stil und Ausdrucksvermögen nicht nachstehen, sollte durch die frei zugänglichen und in den Medien bekannt gewordenen Werke belegt sein. Zu klären bleibt aber, ob KI-Erzeugnisse einem menschlichen Urheber zugeordnet werden können und wenn ja wem. Der nachfolgende Beitrag schließt sich an Teil 1 über die urheberrechtlichen Herausforderungen im Zusammenhang mit generativer KI an und untersucht, ausgehend der aktuellen Entwicklungen in den USA, die urheberrechtliche Schutzfähigkeit von KI-Outputs von Bildgeneratoren wie z.B. Midjourney.
Funktionsweise generativer KI am Beispiel der Bildgenerierung durch Midjourney
Um der Frage nach dem Schutz eines KI-Erzeugnisses nachgehen zu können, muss zunächst geklärt werden, wie generative KI im Bereich der Bildgenerierung funktioniert. Bei Midjourney zum Beispiel, entwickelt durch das gleichnamige Forschungsinstitut aus San Francisco, Kalifornien, handelt es sich um eine Text-zu-Bild-KI. Text-zu-Bild-KI basiert weit überwiegend auf sogenannten Diffusions- und Large Language Modellen. Während Algorithmen von Large-Language-Modellen wie ChatGPT mit großen Datensätzen natürlicher Sprache trainiert werden, haben bildgenerierende KIs zusätzlich ein Training durch Datensätzen mit Bildern erhalten. Die Bilder sind mit entsprechenden Textbeschreibungen versehen. Diese Daten dienen dazu, dem Modell beizubringen, wie verschiedene visuelle Konzepte mit bestimmten Texteingaben korrelieren. Die Daten werden in einem neuronalen Netzwerk verarbeitet. Mathematisch lässt sich die Funktionsweise folgendermaßen beschreiben:
„Ein Diffusionsmodell oder probabilistisches Diffusionsmodell ist eine parametrisierte Markov-Kette, die mithilfe von Variationsinferenz trainiert wird, um nach endlicher Zeit Proben zu erzeugen, die mit den Daten übereinstimmen.“[8]
Verständlicher gesprochen: Ein Diffusionsmodell erlaubt es, mit durch Training verwendeten Daten, neue Datensätze zu generieren. Dies erfolgt, in dem das System Bilder durch das sukzessive Hinzufügen von Rauschen (Gaußsches Rauschen) stückweise „zerstört“ und lernt, wie es das Bild, durch sukzessives Entfernen des Rauchens, wieder zusammensetzen kann. Nach dem Training kann das Diffusionsmodell verwendet werden, um Daten zu erzeugen, indem zufällig abgetastetes Rauschen durch den erlernten Rauschprozess geleitet wird.[9]
Benutzer steuern Midjourney über Discord, einen Onlinedienst für Instant Messaging sowie Sprach- und Videokonferenzen, welcher vor allem im Bereich des Gaming Bekanntheit aufweist.[10] Die Steuerung erfolgt durch die Eingabe eines sog. Prompts, einer Textsequenz, auf deren Basis Midjourney eine Auswahl aus vier Bildern zur Verfügung stellt. Die Textsequenz wird dabei nicht wörtlich durch das System verstanden, sondern in sogenannte Tokens sequenziert, die mit den gespeicherten Daten auf Übereinstimmung geprüft werden.[11] Die KI setzt die Token damit ins Verhältnis zu den vorhandenen Daten. Wurde demnach in einem Prompt beispielsweise Hund erwähnt, gleicht das System trainierte Text-Bildpaarungen mit der Kennung Hund ab und erstellt daraus eine Bilderauswahl. Wurde die KI etwa ausschließlich mit Bildern von Dackeln in der Kennung Hund trainiert, wird auch das durch den Prompt vorgegebene Element Hund äußerliche Züge eines Dackels aufweisen.
Das bedeutet aber auch, dass Modelle wie Midjourney weder einzelne Wörter noch verwendete Grammatik erkennen, sondern die Umsetzung des Prompts durch Wiedergabe statistischer Muster erfolgt, die im Rahmen des Trainings durch Auswertung von Daten und Text-Bildpaarungen erzeugt wurden. Auswahlentscheidungen werden anhand von probabilistisch bedingten Klassenzuweisungen getroffen, welche sich im Laufe des Trainingsprozesses herausgebildet haben. Eine bewusste Entscheidung der KI, welche Elemente auf einem Bild zu sehen sind, findet nicht statt, sondern hängt von den durch Datensätzen erlangten allgemeinen Mustern ab.
Das US-amerikanische Copyright
Der amerikanische Copyright Act legt fest, wann ein Werk schutzfähig ist. Nach 17 U.S. Code § 102(a) ist ein „original work […] of authorship fixed in any tangible medium of expression“ erforderlich. Wann ein Werk als „original work“ anzusehen ist, bestimmt sich nach den Gegebenheiten des Einzelfalls. Nach Auslegung durch den Supreme Court erfordert dies zumindest mehr als ein Minimum an gestalterischer Kreativität (sog. de minimis Schwelle).[12] Obwohl das Copyright eher pragmatisch ist und auf dem Gedanken fußt, dass geistige Arbeit entlohnt werden soll (sog. Anreiztheorie), wird das Erfordernis „work of authorship“ weitgehend anthropozentrisch ausgelegt.[13] Das bedeutet nicht, dass dem Copyright der Einsatz von Hilfsmitteln fremd ist. In der Rechtssache Sarony vertrat der Supreme Court beispielsweise die Auffassung, dass Fotografien schutzfähig sind, auch wenn sie von einem mechanischen Gerät stammen. Es liege auch dann eine geistige Vorstellung des Fotografen vor, wenn das Bild lediglich das wiedergibt, was sich im Zeitpunkt des Auslösens vor dem Gerät befunden hat. Der menschliche Beitrag darf aber nicht zurücktreten. Erst kürzlich betonte der District Court of Columbia, dass „human authorship“ ein „bedrock requirement of copyright“ sei.[14]
Bedeutsam in diesem Kontext ist die in 17 U.S. Code § 201(b) verortete „work made for hire doctrine“. Danach kann auch derjenige „author“ eines Werkes sein, „for whom the work was prepared“. Möglich ist dadurch die Zuweisung des Copyrights auch an eine juristische Person. Eine natürliche Person als Träger des Copyrights ist für „authorship“ folglich in begrenztem Umfang nicht erforderlich.[15]
Eine besondere Rolle im Copyright spielt das Register des USCO. Das USCO darf nur solche Werke eintragen, die nach dem 17 U.S. Code schutzfähig sind, andernfalls muss die Eintragung verwehrt werden (Compendium (Third) Sec. 313.2). Dennoch ist die Eintragung nicht konstitutiv schutzbegründend und bindet die Judikative nicht. Eine Eintragung fungiert daher eher als Indiz für ein Copyright.
Das deutsche Urheberrecht
Ausgangspunkt des Urheberrechts ist die Einordnung als Werk im Sinne des Urheberrechtsgesetzes. § 2 Abs. 2 UrhG erfordert, dass eine persönliche geistige Schöpfung vorliegt. Der Werkbegriff ist unionsrechtlich ausgefüllt und wird durch den EuGH im gesamten Unionsrecht einheitlich ausgelegt. Erforderlich ist Originalität, also ein von der Schöpfung ausgehender bestimmter geistiger Gehalt, der zum Ausdruck gebracht worden sein muss.[16] Die Verbindung zwischen Urheber und seinem Werk und die daraus resultierende rechtliche Stellung fußt auf unterschiedlichen theoretischen Rechtfertigungsansätzen. Teilweise wird auf die Persönlichkeitstheorie von Kant und Hegel zurückgegriffen,[17] teilweise auf die Anreiztheorie der Wirtschaftswissenschaften.[18]
Schutzentstehung tritt kraft Schöpfung in dem Moment ein, an dem die notwendige Gestaltungshöhe zur Indizierung der Originalität überschritten wird. Als unterste Schwelle geistiger Schöpfungen werden die Anforderungen an die zu erreichende Gestaltungshöhe heute in Form der sog. kleinen Münze beschrieben.[19] Demnach können zwar auch Werke von geringem schöpferischem Wert urheberrechtlich geschützt sein.[20] Das Werk im Sinne des Urheberrechts erfordert jedoch menschlichen Einfluss. Dies ist Ausdruck des anthropozentrischen Grundsatzes. Das zeigt das Zusammenspiel zwischen § 2 UrhG und § 7 UrhG, zwischen Werk und Persönlichkeit des Urhebers.
Dem Einsatz von Werkzeugen steht auch das Urheberrecht nicht entgegen. Ein rein maschinell gefertigtes Erzeugnis muss aber auf einen menschlichen Schöpfungsakt zurückzuführen sein, um die direkte Verbindung zwischen Schöpfer und Schöpfung zu gewährleisten. Um die Einteilung eines komplexen Schaffungsprozesses zu vereinfachen, wird auf eine Unterteilung zwischen einer Schöpfung durch und einer Schöpfung mittels KI zurückgegriffen. Während in der Schöpfung durch KI der menschliche Einfluss im gesamten Schöpfungsprozess rudimentär bleibt, beispielsweise durch informationell geringe Anweisungen, nimmt der menschliche Einfluss bei Schaffung mittels KI spürbar zu. Der Übergang zwischen Schaffensprozess durch und mittels eines Werkzeugs ist jedoch letztlich fließend. Die Beurteilung richtet sich danach, wie weit der menschliche Einfluss noch zu determinieren ist.[21]
Persönliche geistige Schöpfung durch KI- Zuordnung der Urheberschaft an die KI selbst
Die anthropozentrische Ausrichtung des Urheberrechts steht einer Zuordnung des Werkes an die KI selbst diametral entgegen. Während die Urheberschaft einer juristischen Person im amerikanischen Copyright in Arbeitsverhältnissen in begrenztem Umfang nach der „work made for hire doctrine“ möglich ist,[22] bleibt eine solche Regelung mangels natürlicher Person dem deutschen Urheberrecht fremd. Das Urheberrecht trifft zwar eine Regelung für Arbeits- und Dienstverhältnisse in § 43 UrhG, aber weist dem Arbeitgeber bzw. Dienstherrn lediglich Nutzungsrechte, nicht auch die Urheberschaft zu.
Im Schrifttum wird teilweise angenommen, dass eine Übertragung der Grundsätze der „work made for hire doctrine“ auf das Verhältnis von KI und Erzeugnis im Copyright möglich ist.[23] Danach würde die KI selbst als „author“ anzusehen sein. Der Begriff des „authors“ setzt schließlich nicht zwangsläufig die Tätigkeit einer natürlichen Person voraus. Dennoch bestehen wortlautbedingte Hürden des Wortlauts, wenn etwa 17 U.S. Code § 101 von „employees within the scope of his or her employment“ oder „written instruments signed by them“ spricht. Beide Erfordernisse erscheinen durch KI-Systeme nicht ausfüllbar, da sie an menschliche Arbeitskraft anknüpfen.[24] Zu überwinden wäre in diesem Fall außerdem die bislang geltende Beschränkung des Anwendungsbereichs der Doktrin auf Arbeits- oder arbeitsähnliche Verhältnisse.[25]
Eine solche Diskussion würde sich nach deutschem Recht nur unter dem Begriff der „E-Person“ führen lassen. Die Einordnung als Rechtssubjekt wird hier aber, neben der weitreichend bestehenden Kritik an dem Konstrukt im Allgemeinen, eher unter dem Gesichtspunkt des Haftungsrechts diskutiert. Die Zuweisung der Urheberschaft an das KI-System selbst ist de lege lata nicht vorgesehen. Weder das Urheberrecht noch das Copyright sehen in ihrer aktuellen Gesetzesfassung ein Rechtsubjekt „KI“ vor. Eine Schöpfungszuweisung an ein KI-System ist damit im Urheberrecht nicht möglich, im Copyright zumindest nach aktueller Auslegung nicht geltende Auffassung.
Der Nutzer als Schöpfer
Denkbar wäre die Zuweisung des Urheberrechts an den Nutzer des jeweiligen KI-Systems. Dieser initiiert den Schaffensprozess durch Eingabe des Prompts, auf dessen Basis die KI arbeitet. Der Nutzer gibt durch die Eingabe des Prompts das Grundmuster für das durch die KI zu erzeugende Ergebnis vor. Einzuwenden dürfte sein, dass die KI die Umsetzung der durch den Prompt eingegebenen Anweisung durch Abgleich mit den vorhandenen Trainingsdaten und daraus erlernten statistischen Mustern selbst trifft. Der Nutzer gibt demnach die Richtung, die KI dagegen das statistisch bedingte Ergebnis vor. Da dem Nutzer der zugrundeliegende Algorithmus nicht geläufig ist und damit keine Vorhersage über das Endergebnis getroffen werden kann und die KI die innere Vorstellung des Nutzers nicht kennt, könnte bereits der Zufallsfaktor dem Schutzgedanken entgegenstehen.
Grundsätzlich ist Zufall jedoch kein Schutzhindernis. Anerkannt ist beispielsweise der Werkschutz von Fotografien.[26] Auch hier kann vertreten werden, dass der Zufall das Endergebnis bestimmt. Der Fotograf kann unmöglich vorhersehen, welche Ablichtung am Ende des Intervalls genau welche Elemente beinhaltet. Das gilt vor allem dann, wenn eine zeitliche Abfolge von Aufnahmen erfolgen soll. Es wird aber überwiegend angenommen, dass der ausreichende menschliche Einfluss darin besteht, dass durch Auswahl des Motivs, des Kamerastandpunkts und der Kameraeinstellungen der Spielraum des Zufalls so stark eingeschränkt ist, dass die Kamera insgesamt als ein Werkzeug betrachtet werden kann und das Ergebnis durch den Fotografen auch im Moment jedes einzelnen Auslösens kontrolliert wird. Die Rechtsprechung und herrschende Meinung lassen es deswegen genügen, dass eine Person eine Kamera fest installiert und darauf programmiert, in bestimmten Intervallen Aufnahmen zu machen.[27]
Eine derartige Kontrolle wird dem Nutzer eines KI-Systems wie Midjourney allerdings wohl nicht zugeschrieben. Zu stark hängt das Ergebnis von verschiedenen nicht kontrollierbaren Faktoren ab, deren Einflussnahme im Verlauf des Schaffensprozesses technisch bedingt weiter abnehmen.[28] Der Nutzer kann nicht vorhersehen, wie sein Input durch das Programm verarbeitet wird, welche Parameter wie gewichtet werden und wie letztlich die zugrundeliegenden statistischen Muster in das Erzeugnis eingebettet sind. Eine Einordnung des Prompts als Idee oder Anregung ist weder nach Urheberrecht[29] noch nach Copyright (17 U.S. Code § 102(b)) schutzfähig.
Ein zu honorierender geistiger Schöpfungsakt kann allenfalls in der Auswahl der durch die KI erzeugten Werke des Nutzers zu sehen sein. Im Urheberrecht mag das unter der Präsentationslehre Kummers[30] noch möglich sein, die einen Schöpfungsakt auch beim bloßen Auffinden von Gegebenheiten anerkennt. Sie wird aber weitestgehend einhellig abgelehnt. Die reine Auswahl des „richtigen“ Bildes durch den Nutzer weist keine Gestaltungshöhe auf.[31]
Ebenso zu verwerfen wäre der Gedanke, dass die erzeugten Bildnisse eine Verbildlichung der zugrundeliegenden eingegebenen Wortfolge sind.[32] Grundsätzlich anzuerkennen ist, dass Prompts urheberrechtlichen Schutz als Sprachwerke genießen können.[33] Zu verwerfen ist die Annahme aber deshalb, weil die Prompts lediglich als Ideenfundus oder Anregung dienen. Das System startet grundsätzlich bei null und baut das Bild auf der Grundlage der trainierten Daten auf. Es nutzt den Prompt damit lediglich im Sinne einer Inspiration oder Anregung. Eine Übertragung kann bereits deswegen schon nicht möglich sein, da die Vorstellung des Nutzers bei Eingabe des Prompts und das Ergebnis der KI nach Auswertung des Prompts völlig unterschiedlich sein können. Dem Nutzer kann deswegen das Urheberrecht bei Schöpfung durch KI nicht zuerkannt werden.
Schöpfungsvorgabe durch den Programmierer?
Das eröffnet die Frage, ob nicht dem Programmierer oder den das System trainierenden Personen das Copyright zustehen sollte. Schließlich hat die Konzeption des zugrundeliegenden Quellcodes maßgeblichen Einfluss darauf, wie das System die zu verarbeitenden Daten verarbeitet und evaluiert. Da das Ergebnis Ausdruck eines statistischen Musters ist, dessen Entstehung durch die Auswahl der verwendeten Daten bedingt ist, darf die Kausalität der verwendeten Daten für das im Ergebnis angewandte Muster nicht außer Acht gelassen werden. Die Frage wird dennoch in den USA wie in Deutschland dennoch überwiegend verneint.
Im Copyright wird darauf verwiesen, dass das Werk nicht dem direkten Einfluss des Programmierers ausgesetzt ist. Wie angezeigt, obliegt die Gestaltung im Ergebnis dem System und nicht der Vorgabe des Programmierers. Das Endergebnis ist, wie auch das USCO befindet, ein Produkt des Zufalls.[34] Es mangelt an der Verknüpfung des persönlichen Schöpfungsgedankens des Programmierers und dem Output des Systems. Jener kann bei der Programmierung des Quellcodes nicht alle möglichen Erzeugnisse bereits in seinem geistigen Gehalt erfasst haben.
Im Urheberrecht wird diskutiert, ob nicht dem Programmierer als „Mastermind“ das KI-Erzeugnis zugerechnet werden könnte.[35] Dies lässt sich anhand eines Vergleiches mit einem menschlichen Gehilfen erläutern. Wird etwa einem Steinmetzmeister das Schutzrecht an einer Statue selbst dann zugeschrieben, wenn diese von einem Lehrling geschlagen wird – zumindest soweit der kreative Schöpfungsbauplan aus seiner Feder stammt – so könnte gleiches bei der KI gelten. Dass indes der Vergleich hinkt, zeigt sich besonders daran, dass in diesem Fall das Ergebnis Ausdruck des Veranlassers sein muss.[36] Im Falle eines zwischengeschalteten menschlichen Gehilfen, dem kreativer Freiraum zugeordnet wird, kommt allenfalls ein Miturheberrecht in Betracht. Im Falle von KI-Produkten gibt es allerdings keinen menschlichen Gehilfen. Die Konzeption stammt vom Nutzer und das Ergebnis ist eine Zufallsabfolge, die an den eingegebenen Parametern des Nutzers orientiert ist. Der Beitrag des Programmierers verblasst damit deutlich.
Möchte man die Zuordnung an den Programmierer konstruieren, dürfte dies nur unter der Annahme gelten, der Einfluss des zugrundeliegenden Quellcodes sei so maßgeblich, dass dies selbst autonome Systementscheidungen und Nutzereinflüsse überwindet. Dass dies schwer der Fall sein kann, wenn Ergebnisse durch probabilistisch generierte Muster bestimmt werden, liegt nahe. Die Generierung von Mustern und Klassen und damit der Blaupause des zu schaffenden Bildes erfolgt zeitlich wie auch technisch in wesentlichen Teilen losgelöst von der Programmierarbeit. Der Programmierer kann im Zeitpunkt des Schaffens des Quellcodes nicht vorhersehen, welche Erkenntnisse die KI aus dem Trainingsvorgang zieht, auf welche Weise sie die gewonnen Erkenntnisse auf die Bildgenerierung anwendet und in welchem Umfang Vorstellungen der Nutzer mithilfe der Prompts umgesetzt werden. Zu vergleichen wäre dies mit der Situation, wenn einem Steinmetz jegliche Schöpfung seines Gehilfen zugerechnet wird, nur weil er ihn ausgebildet hat und durch das Beibringen von Fertigkeiten den „Grundstein“ für sämtliche zukünftige Schöpfungen gelegt hat. Für die Auswahl der Trainingsdaten kann nichts anderes gelten. Unberührt bleibt davon, dass u.U. in der Auswahl und Selektierung der Daten selbst ein Werk bestehen kann.[37] Im Zeitpunkt der Auswahl ist der menschliche Einfluss auf das Endergebnis aber kaum noch zu erkennen.[38]
Schließlich könnten aber Programmierer, Auswahlpersonen und Nutzer derart eng zusammenarbeiten, dass das Endergebnis allen zusammen in Form der sog. Miturheberschaft (§ 8 UrhG und 17 U.S. Code § 101) zugeordnet werden kann. Dies wird unter dem Copyright diskutiert, aber weitestgehend verworfen. Es scheitert bereits an der notwendigen übereinstimmenden Gestaltungsabsicht.[39] Gleiches gilt für das deutsche Urheberrecht. Die Miturheberschaft setzt voraus, dass alle Beteiligten einen schöpferischen Beitrag geleistet haben müssen und so auf die Formgestaltung einen bestimmbaren individuellen Einfluss haben.[40] Dies ist gerade nicht der Fall. Zudem muss der Beitrag jeweils als Werk zu klassifizieren sein.[41] Wie bereits beschrieben, fehlt es an einem Werk von Programmierer und der Auswahlperson. Weiterhin würde die Anerkenntnis der bestimmbaren Gestaltungsleistung des KI-Systems, die Urheberschaft des jeweils weiteren Beteiligten am einheitlichen Werk noch weiter infrage stellen.
Schaffung des Werkes mittels KI
Die Frage der Schutzfähigkeit von KI-Erzeugnisse verkompliziert sich, desto mehr der menschliche Einfluss im Schaffungsprozess durchschimmert und damit alle wesentlichen gestalterischen Entscheidungen auf menschlichem Ursprung fußen. In diesem Fall nutzt der Mensch die KI als Werkzeug, was der Verwendung von bekannten Werkzeugen wie Fotoapparaten, Pinsel oder modernen Gestaltungsprogrammen wie Adobe oder Photoshop ähnelt. Der Schutzgehalt muss deswegen bei Werkschöpfungen mittels KI der gleiche wie bei genannten herkömmlichen Werkzeugen sein. Damit fallen automatisch solche Erzeugnisse in den Schutzbereich des Urheberrechts, bei denen die KI im Autonomiegrad keine eigenständigen Entscheidungen trifft. Die Umsetzung der gestalterischen Eingebung ist damit durch den Gestaltungswillen des Menschen begrenzt und nicht durch eigenständige Umsetzungsmuster der KI charakterisiert. Je intensiver die handelnde Person damit das Endergebnis vorgibt, desto eher liegt eine menschlich-gestalterische Leistung vor.[42] In solchen scheiden auch konsequenterweise gestalterische Einflüsse von Programmieren oder sonstigen Dritten aus. Das entscheidende Problem ist dabei die Unterscheidung, wann der Umsetzungsakt letztlich noch auf menschlicher Gestaltung basiert und wann die Umsetzung nur noch der KI zuzuordnen ist.
Nach dem USCO reicht eine detaillierte gestalterische Einwirkung des Künstlers durch verfeinerte Prompts noch nicht aus, um Copyright an dem Gesamtwerk zu erhalten. Begründet wird dies damit, dass der Autor nicht „the inventive or master mind“ ist, wie es der Supreme Court für den „author“ fordert.[43] Technisch ist dem Schaffungsprozess ein zu großer Zufallsfaktor zwischengeschaltet, als dass ein hinreichender innerer Bezug zwischen Schöpfer und Schöpfung besteht. Midjourney baut grundsätzlich das generierte Bild autonom auf und nutzt den Input des Nutzers, unabhängig davon wie detailliert dieser ausfällt, lediglich als Anregung. „Users of Midjourney do not have compareable control over the initial image genererated, or any final image.“[44] Daraus folgt, dass mangels hinreichenden inneren Bezugs kein Copyright bestehen kann. Dies wird vor allem damit bekräftigt, dass der Unterschied zwischen Prompt und Output signifikant sein kann, auch wenn eine detaillierte Vorgabe besteht.[45] So kann der Nutzer mit einem einzelnen Prompt eine unendliche Vielzahl unterschiedlicher Bilder generieren.
Das dürfte auch im deutschen Urheberrecht nicht anders zu beurteilen sein. Auch wenn der Mensch sich die KI zu eigen macht, obliegt die finale Umsetzung immer dem KI-System, das die Entscheidung über die Gestaltung nach Abgleich des in Token zerlegten Prompts mit den vorhandenen Trainingsdaten unter Anwendung statistischer Muster trifft und daraus ein Erzeugnis generiert. Der Prompt wird, unabhängig davon, wie detailliert er geschrieben ist, nur als Inspiration oder Anregung verwendet. Auch wenn damit das Werk im Ergebnis nur mittelbar auf dem Zufallsfaktor aufbaut, genügt die menschliche Einflussnahme nicht.[46]
KI-Erzeugnisse ohne Schutz durch Copyright/Urheberrecht?
De lege lata sind die Erzeugnisse von generativer KI der Klasse Midjourney und Co. in der Regel nicht im Schutzbereich des geistigen Eigentums zu verorten. Das bedeutet aber nicht, dass die Werke grundsätzlich in keiner Weise dem Werkschutz zumindest partiell unterfallen können. Stellt ein KI-System beispielsweise eine Bildfolge her und diese wird in einem Werk zusammengefasst, bleibt die Möglichkeit des Copyright als Kompilation (Compilation) erhalten.[47] Auch dem Urheberrecht unterfallen sogenannte Sammelwerke, wenn die Auswahl oder Anordnung einzelner Elemente selbst die Schwelle der persönlichen geistigen Schöpfung überschreiten und das unabhängig davon, ob die einzelnen Elemente schutzfähig sind.[48] Zudem besteht die Möglichkeit, das Erzeugnis, als Grundlage zu verwenden, um dies als Ausgangspunkt eigener gestaltender Tätigkeit zu machen. In diesem Fall ist ebenfalls Werkschutz annehmbar. Das Copyright gewährt dem Autor Werkschutz auch dann, wenn ein nicht schutzfähiges Werk nachträglich modifiziert wurde, solange die neue Kreation „sufficient amount of original authorship“ aufweist.[49]
Auch das Urheberrecht belohnt die Bearbeitung von an sich gemeinfreien Werken in § 3 S. 1 UrhG mit einem eigenen Bearbeiterurheberrecht.[50] Der Beitrag darf nicht minder als das Erfordernis aus § 2 Abs. 2 UrhG ausfallen, sodass alle Rechte eines Urhebers (nur) an dem Beitrag gewährt werden.[51] Damit bleibt der Weg für Künstler offen, durch KI generierte sich zu eigen zu machen und kreativ so anzureichern, dass partieller Werkschutz besteht. Dies steht auch der Eintragung beim USCO nicht entgegen. So wurden 2023 ungefähr 100 Werke mit durch KI-System geschaffenen Teilelementen eingetragen, zumindest solange die KI-Beiträge kenntlich gemacht wurden.[52]
Zu beachten bleibt hierbei die Beweisbarkeit des vermeintlichen Urhebers. Während die Eintragung des Werkes im USCO die Darlegung der zum Copyright erforderlichen Beweise gegebenenfalls dargelegt werden müssen,[53] muss sich der vermeintliche Urheber in gerichtlichen Auseinandersetzungen spätestens mit der Frage konfrontiert sehen, ob sein Werk tatsächlich seine Schöpfung ist.[54]
Ausblick
Nach aktuellem Stand der Rechtslage besteht keine Grundlage, generative KI-Erzeugnisse von Bildgeneratoren wie Midjourney und Co. dem Urheberrecht zu unterwerfen. Autonome Erzeugnisse können keine persönlichen geistigen Schöpfungen oder „work of authorship“ sein. Ob dies eine Momentaufnahme bleibt, muss abgewartet werden. Gerade im Copyright wird erwogen, ob nicht die Grundsätze der „work for hire doctrine“ adaptiert werden, um diese auch KI-Erzeugnissen zuordnen zu können. Im deutschen Urheberrecht wird ein Schutz de lege ferenda weitestgehend auch künftig abzulehnen sein, wenn nicht an der anthropozentrischen Ausrichtung gerüttelt werden soll. Zu wenig bleibt der menschliche Beitrag erhalten, um dies vor dem Hintergrund benannter persönlichkeitsrechtlicher Verknüpfungen oder im Wege der Anreiztheorie rechtfertigen zu können. Ob ein solcher Wandel vor dem Hintergrund sich anbahnender Dominanz von KI-Erzeugnissen wünschenswert ist, ist eine andere Frage.
Möglicherweise zeichnet sich ein paralleler Entwicklungsschritt zwischen Anbietern von KI-Systemen und der rechtlichen Einschätzung von KI-Erzeugnissen ab. Es ist nicht von der Hand zu weisen, dass ein Wettbewerbsvorteil dort entsteht, wo KI urheberrechtlich schutzfähige Werke kreieren kann und dennoch das Maß kreativer Autonomie beibehält. Daraus folgend wird es eine parallele Marktsegmentierung geben, die Werke ohne rechtliche Verteidigungsmöglichkeit aufweist. Es bleibt abzuwarten, ob in beiden Rechtsordnungen der Drang ansteigen wird, das Gebiet generativer Erzeugnisse stärker in den Schutzbereich des geistigen Eigentums einbeziehen zu wollen, im Urheberrecht beispielsweise durch eine Etablierung eines verwandten Schutzrechts, oder ob dafür keine Notwendigkeit besteht.
Fakt ist, dass eine neue Zeitspanne des künstlerischen Schaffens an, die seit den ersten Anfängen digitaler Kunst bahnbrechende neue Maßstäbe aufstellt. Hier sind die Entwicklungen mit Spannung zu erwarten.
Die Autoren:
Vincent M. Kästle ist Doktorand und wissenschaftlicher Mitarbeiter am Lehrstuhl von Prof. Dr. Felix Maultzsch, LL.M. an der Goethe Universität Frankfurt am Main.
Tobias Wolfenstätter ist wissenschaftlicher Mitarbeiter in der Kanzlei Arnecke Sibeth Dabelstein in Frankfurt am Main.
Responsible Editor:
Isabel Cagala, TLB Co-Editor-in-Chief
[1] Teil 1 des Beitrags „Urheberrechtliche Herausforderungen im Zusammenhang mit generativer KI“: https://www.dajv.de/kuenstliche-intelligenz/getty-images-v-stability-ai-urheberrechtliche-herausforderungen-im-zusammenhang-mit-generativer-ki/
[2] https://supreme.justia.com/cases/federal/us/111/53/
[3] Zur Entscheidung: https://www.copyright.gov/docs/zarya-of-the-dawn.pdf
[4] https://www.copyright.gov/rulings-filings/review-board/docs/a-recent-entrance-to-paradise.pdf
[5] Stephen Thaler v. Shira Perlmutter, Civil Action No. 22-1564
[6] https://copyright.gov/rulings-filings/review-board/docs/SURYAST.pdf
[7] Nach dem 17 U.S. Code § 302(a) gilt dies nur für Werke, die nach, an oder nach dem 1. Januar 1978 entstanden sind. Sowohl das Urheberrecht als auch das Copyright habe ein abgestuftes System für Werke, die beispielsweise anonym veröffentlicht wurden § 66 UrhG und 17 U.S. Code § 303.
[8] https://arxiv.org/pdf/2006.11239.pdf
[9] Eine detaillierte Beschreibung der Funktionsweise eines Diffusionsmodells: https://www.assemblyai.com/blog/diffusion-models-for-machine-learning-introduction/
[10] Eine Nutzung über das Web ist im Wege einer Alpha mittlerweile auch möglich: https://www.docma.info/ki/alpha-preview-midjourney-als-webversion
[11] https://docs.midjourney.com/docs/prompts-2
[12] Feist Publications, Inc v. Rural Telephone Service Co, Supreme Court, 499 U.S 340, 345
[13] Urantia Found. v. Kristen Maaherra, 114 F.3d 955, 957–59 (9th Cir. 1997)
[14] Stephen Thaler v. Shira Perlmutter, Civil Action No. 22-1564
[15] Die Zuordnung ist nur unter bestimmten Voraussetzungen möglich nach 17 U.S. Code § 101 of the US Copyright Act festlegt.
[16] Stephen Thaler v. Shira Perlmutter, Civil Action No. 22-1564
[17] Dornis, GRUR 2019, 1252, 1257 ff.
[18] Dornis, GRUR 2019, 1252, 1258
[19] BGH GRUR 1995, 581, 582 – Silberdistel; zurückzuführen auf Elster, Gewerblicher Rechtsschutz, 1921, S. 40
[20] BGH GRUR 1981, 267, 268; vorgesehen in der Gesetzesbegründung BT-Drucks. IV/270, S. 38
[21] Fierdag, Die Aleatorik in der Kunst und das Urheberrecht: unter besonderer Berücksichtigung der computer-generated works, 2005, S. 68
[22] Lejeune, CRi 2023, 141, 143
[23] Bridy, Coding Creativity: Copyright and Artificially Intelligent Author, 2012 Stan. Tech. L. Rev.5, 21
[24] Stephen Thaler v. Shira Perlmutter, Civil Action No. 22-1564
[25] Community for Creative Non-Violence v. Reid, 490 U.S. 730, 731 (1989) (holding that the meaning of “employee” under Sec. 101 must be determined with reference to agency law) – Lejeune, CRi 2023, 141, 144
[26] In den USA nach 17 U.S. Code § 102(a) und in Deutschland entweder als Werk im Sinne des § 2 Abs. 1 Nr. 5 UrhG oder als verwandtes Schutzrecht im Sinne eines Lichtbildnisses nach § 72 UrhG.
[27] Schulze in: Dreier/Schulze, § 72 Rn. 33
[28] Papastefanou, CR 2023, 1, 5 f.
[29] BGH GRUR 2003, 231, 233 – Staatsbibliothek; BGH GRUR 1995, 47 f. – Rosaroter Elefant; OLG München NJOZ 2004, 867 f.
[30] Kummer, Das urheberrechtlich schützbare Werk, 1968
[31] BeckOK UrhR/Rauer/Bibi UrhG § 2 Rn. 50
[32] Vorgetragen in der Sache Zaraya; das USCO hat die Schutzfähigkeit von Prompts nicht untersucht.
[33] Maamar, ZUM 2023, 481, 487
[34] USCO „Zaraya of the Dawn“, S. 9
[35] Dornis, GRUR 2021, 784, 787; Ginsurg/Budiardjo, 34 Berkeley Tech L.J. 343, 358 (2019)
[36] Loewenheim/Pfeifer in: Schricker/Lowenheim § 7 UrhG Rn. 7-8
[37] BeckOK UrhR/Rauer/Bibi UrhG § 2 Rn. 53
[38] Papastefanou, CR 2023, 1, 5
[39] Aalmuhammed v. Lee, 202 F. 3d 1227
[40] Wandtke/Bullinger/Thum, 6. Aufl. 2022, UrhG § 8 Rn. 15
[41] BGH GRUR 1994, 39, 40 – Buchhaltungsprogramm
[42] BeckOK UrhR/Rauer/Bibi UrhG § 2 Rn. 54
[43] USCO „Zaraya of the Dawn“, S. 9
[44] USCO „Zaraya of the Dawn“, S. 9
[45] USCO „Zaraya of the Dawn“, S. 9
[46] Papastefanou, CR 2023, 1, 5; BeckOK UrhR/Rauer/Bibi UrhG § 2 Rn. 54; Welser, GRUR-Prax 2023, 57, 58
[47] Das Copyright schützt „the collection and assembling of preexisiting materials […] that are selected, coordinated, or arranged […]“ nach 17 U.S. Code § 101.
[48] Wandtke/Bullinger/Marquardt, 6. Aufl. 2022, UrhG § 4 Rn. 4; LG Mannheim GRUR-RR 2004,196.
[49] Compendium (third) § 313.6(D)
[50] BGH GRUR 1991, 531 – Brown Girl I; GRUR 1991, 533 – Brown Girl II
[51] OLG Hamburg ZUM-RD 2019, 575, 583
[52] USCO „Suryast“, S. 4
[53] 37 C.F.R Sec. 201.7(4).
[54] BeckOK UrhR/Rauer/Bibi UrhG § 2 Rn. 127 ff.