05 / 11 / 2019
Big Data, Urheberrecht und AI: Rechte an „Learnings“ von Software bei Verwendung von selbstlernenden Algorithmen 
Author

Deep Learning, neuronale Netze: selbstlernende Algorithmen sind der Kern der Big Data-Revolution. Gerade Startups setzen oft auf innovative Softwarelösungen, die auf den Prinzipien des maschinellen Lernens beruhen. Allerdings benötigen selbstlernende Algorithmen große Mengen an gut strukturierten Datenbeständen. Da Startups oftmals noch keine Millionen Kunden, jedoch viel technische Expertise haben, ergibt sich das Potential für Kooperationen mit großen Unternehmen, da diese typischerweise riesige unerschlossene Datenbestände haben, aber nicht das nötige Know-How, um diese selbst zur Anlernung von intelligenten Algorithmen zu nutzen. 

Bei solchen Kooperationen stellt sich dann schnell die Frage, welche Rechte an den Deep-Learning-Algorithmen eigentlich bestehen. Zudem zeigt sich das sehr berechtigte Bedürfnis von Startups, das eigene Know-How und damit einen zentralen Wert des eigenen Unternehmens optimal zu schützen. Ob und wie dies möglich ist, soll dieser Beitrag erläutern. 

Wie funktioniert ein Deep-Learning-Algorithmus?

Um die unterschiedlichen Rechte an selbstlernenden Algorithmen zu erläutern, folgt zunächst ein kurzer Überblick über die Funktionsweise eines Deep-Learning-Algorithmus.  

Die Funktionsweise von selbstlernender Software auf Deep-Learning ist in Anlehnung an den natürlichen Aufbau des Gehirns entwickelt worden. Dabei hat sich gezeigt, dass die Vernetzung zwischen den einzelnen Nervenzellen und deren Abhängigkeit ein entscheidender Faktor ist, um „intelligente“ Ergebnisse zu erzielen. Ein selbstlernender Algorithmus besteht somit – (sehr)  vereinfacht gesagt – aus virtuellen Nervenzellen, die über (viele) verschiedene Ebenen (Deep-Learning!) aus Eingabedaten (z.B. Fotos) bestimmte Ausgabedaten (z.B. Katze ja oder nein) produzieren.  

Dabei ist das Grundkonstrukt somit die Anzahl der virtuellen „Nervenzellen“ und die Anzahl der Ebenen nur die Basis. In diesem Stadium kann der Algorithmus noch keine sinnvollen Ergebnisse produzieren. Jeder selbstlernende Algorithmus kann ohne die nötige Justierung bzw. ohne die notwendigen Trainingsdaten eine Katze nicht von einem Auto unterscheiden. Es wird somit eine Vielzahl von strukturierten Daten benötigt, d.h. im Beispiel eine Vielzahl (Big Data!) von Fotos mit und ohne Katzen, wobei jeweils markiert ist, welches Foto eine Katze enthält. Mit diesen Daten wird der Algorithmus dann gefüttert. Letztlich werden dann mathematische Verfahren (v.a. statistische Verfahren und lineare Algebra) verwendet, um die optimale Abhängigkeit für die Lösung der spezifischen Aufgabe zwischen den virtuellen Nervenzellen zu bestimmen.  

Wenn nun der richtige Aufbau gewählt wurde und genügend Katzenfotos präsentiert wurden, sollte der Algorithmus die Fotos mit den Katzen mit einer gewissen Wahrscheinlichkeit erkennen können (nebenbei bemerkt, hat der Algorithmus natürlich keine Vorstellung davon, was der Unterschied zwischen einer Katze und einem Auto ist, er erkennt nur einen statistischen Zusammenhang zwischen dem Bild und seinen Trainingsdaten). Das tatsächliche Ergebnis des Ganzen, die „Learnings“, ist daher eine strukturierte Reihe von Zahlen, die bestimmte Gewichtungen zwischen den einzelnen „Nervenzellen“ und deren Verknüpfungen indizieren. Wenn man nun diese „Learnings“ auf einen Algorithmus derselben Struktur, d.h. derselben Anzahl an „Nervenzellen“ und Ebenen, überträgt, ist er genauso „intelligent“ wie der Ursprungsalgorithmus. In den „Learnings“ liegt somit der entscheidende Baustein für die Fähigkeit des Algorithmus.  

Die Rechte an der selbstlernenden Software und den „Learnings“ 

Der Ausgangspunkt des gerade geschilderten Algorithmus, also die in Software niedergelegte grundlegende Struktur der “Nervenzellen” sowie der Anzahl der Ebenen und der Verknüpfung zwischen ihnen, ist als Software selbst sowohl im Objekt- als auch im Quellcode geschützt (s. hierzu den WSS-Blogbeitrag: Rechte an programmierter Software – Wem gehört eigentlich was?). Das Problem ist, dass dieser Algorithmus selbst nicht in der Lage ist, spezielle Probleme zu lösen. Nur die speziellen Learnings“ versetzen die Software in die Lage, Katzen von Autos zu unterscheiden. Essentiell ist daher die Frage, ob auch die „Learnings“ urheberrechtlich geschützt werden können.  

Persönlich-geistige Schöpfung als Voraussetzung 

Hierbei besteht das Problem, dass die „Learnings“, um einen leistungsschutzrechtlichen Schutz nach § 69a Abs. 1 UrhG zu genießen, das Ergebnis einer persönlich-geistigen Schöpfung sein müssen, d.h. ein Mensch muss bei ihrer Entstehung zumindest mitwirken. Die „Learnings“ sind jedoch nur Zahlensätze, die bei dem Training des Algorithmus errechnet wurden. Dabei läuft der oben skizzierte Prozess oftmals ohne Einwirkung von Menschen ab. Bei der Anzahl der verarbeiteten Daten ist dies auch praktisch kaum anders möglich. Eine persönlich-geistige Schöpfung scheidet daher nach dem aktuellen Rechtsverständnis in solchen Fällen aus, weswegen in diesen Fällen auch kein urheberrechtlicher Schutz nach § 69a Abs. 1 UrhG besteht. Nur in den Fällen, in denen Menschen noch zur Strukturierung der Daten oder im Feedback-Loop involviert sind, kommt ein Schutz der ”Learnings”in Betracht. 

Denkbar erscheint daneben der Schutz der „Learnings“ als Datenbank gemäß § 87aUrhG: danach werden strukturierte Datensätze geschützt, wenn zur Herstellung erhebliche Investitionen nötig waren. Im Gegensatz zum Schutz der Software ist für diesen Schutz auch keine geistig persönliche Schöpfung notwendig. Die „Learnings“ sind als Zahlensätze auch grundsätzlich zum Schutz als Datenbank geeignet. Allerdings sollen als Datenbank gemäß § 87a UrhG nur zusammengestellte Einzelinformationen geschützt werden. Der Schutzgegenstand des Rechts an Datenbanken liegt nicht in den separaten Einzelinformationen, sondern in der übergeordneten Struktur. Bei den „Learnings“ hat die einzelne Zahl aber für sich genommen keine für sich stehende Bedeutung. Erst in Verbindung mit den vielen anderen wird daraus zusammengenommen eine bedeutungsvolle Information. Letztlich stellen die “Learnings” eine einzelne zusammenhängende Information dar, nicht eine Zusammenstellung von für sich genommenen sinnvollen Einzelinformationen. Daher scheidet auch ein Schutz als Datenbank aus.

Wichtig

Im Ergebnis ist daher ein urheberrechtlicher Schutz der „Learnings“ im Regelfall der maschinellen Erstellung ausgeschlossen.  

Angesichts dieser enormen wirtschaftlichen Bedeutung der “Learnings” und des Aufwands, der aufgewandt wird, um sie zu ermitteln, ist dieses Ergebnis zwar unbefriedigend, aber vor dem Hintergrund der Systematik der bisherigen Gesetzeslage nachvollziehbar. Interessant wird zu sehen, ob der (europäische) Gesetzgeber in Zukunft Leistungsschutzrechte für “Learnings” selbstlernender Algorithmen einführt. 

Welche anderen rechtlichen Schutzmöglichkeiten gibt es noch? 

Es hat sich gezeigt, dass im Status-Quo die Learnings“ nur in bestimmten Fällen urheberrechtlich geschützt sind. Daher stellt sich die Frage, wie ein rechtlicher Schutz noch erreicht werden kann. Neben einem patentrechtlichen Schutz kommt darüber hinaus insbesondere der Schutz der “Learnings” als Geschäftsgeheimnis in Betracht. Nach dem Geschäftsgeheimnisgesetz können betriebliche Geheimnisse, wie z.B. die „Learnings“, unabhängig von den Voraussetzungen des Urheberrechts (etwa dem Erfordernis einer persönlich-geistigen Schöpfung) geschützt werden. Dieser Schutz hat jedoch im Vergleich zum Urheberrechtsschutz einige Nachteile: 

  • Der Schutz als Geschäftsgeheimnis entsteht nicht automatisch mit  Vollendung des Werkes, sondern ist dafür notwendig, dass das Unternehmen ein Geheimhaltungsinteresse und einen zum Ausdruck gebrachten Geheimhaltungswillen hat (s. hierzu den WSS-Blog: Schutz vor Ideenklau – Der Geschäftsgeheimnisschutz).  
  • Der Schutz als Geschäftsgeheimnis ist schwächer als der urheberrechtliche Schutz ausgeprägt  

Tipp

Es empfiehlt sich daher, in Kooperationssituationen zusätzliche Rechtsinstrumente anzuwenden, um zu verhindern, dass spezifische “Learnings” über das konkrete Kooperationsprojekt verwendet werden. Ein probates Mittel sind mit Vertragsstrafen bewehrte Wettbewerbsverbote. Diese können vereinbart werden, um eine unerlaubte Verwendung der „Learnings“ bei der Konkurrenz zu verhindern oder eine anderweitige Verwendung der eigenen Leistungen bzw. Trainingsdaten auszuschließen. 

Kooperationen – Schriftliche Verabredung über Rechte entscheidend 

Fazit

Abschließend bleibt zusammenzufassen, dass angesichts der bisher unsicheren Rechtslage bei selbstlernenden Algorithmen die Rechteverteilung immer sorgfältig geprüft werden muss. Darüber hinaus ist es dringend zu empfehlen, bei Kooperationen auf klare vertragliche Regelungen zu achten. Es sollte genau festgehalten werden, wer welche Rechte an einem selbstlernenden Algorithmus erhält und wie die Rechte an „Learnings“ von selbstlernenden Algorithmen geschützt werden sollen. So kann eine faire und leistungsangemessene Verteilung der Rechte an dem Algorithmus und insbesondere den „Learnings“ erzielt werden.  

Get in touch