With the new copyright provisions effective since April, an exception to copyright protection in the context of scientific research was introduced, bringing legal certainty for Data Mining processes.
On 1 April 2020, the amendments to the Swiss Copyright Act (CopA), which the Federal Parliament had adopted last September after years of preparatory work, finally came into force. The primary aim of the revision was to adapt the CopA to the Internet age, for purposes of which compromise solutions were enacted in several different areas in order to address the divergent interests of authors, producers and users.
The present article deals with the newly introduced exception to copyright protection in the context of scientific research and its application to data mining and its subtype text mining, often referred to collectively as Text & Data Mining (TDM).
Fundamentals of Data Mining
TDM is an automated, computer-based method of analysing large amounts of text or data (big data) and interlinking them so as to discover cross-references, connections and patterns and thus to gain new insights. Whereas actual data mining is used for analysing large structured data sets, text mining is utilised on unstructured text files.
Because of the tremendous amounts of text and data available on the Internet, TDM has become a standard practice and is employed for all types of purposes, not only in scientific fields of research, such as the pharmaceutical industry and biomedicine, but also outside research, such as in marketing and journalism. Furthermore, TDM is used in developing applications based on artificial intelligence.
Relevance of copyright law
The TDM process normally starts with the creation of a data set on which the TDM software is then utilised for the purpose of analysing the data set. In this process, data are regularly copied and stored. If the data in question involve works as defined by copyright law (e.g. scientific or technical texts, images, audio-visual media or collections of data), the TDM process involves acts of reproduction of copyrighted works, e.g. through permanent storage of the works in the data set, through reformatting of the works contained in the data set or through their temporary storage during the analysis. Without either the author’s consent or statutory exceptions, such reproduction acts constitute copyright infringements.
Copyright regulation
Previous provisions in Switzerland
Prior to the revision, the CopA did not contain an exception to the author’s exclusive right in favour of scientific research or specific provisions on TDM.
Granted, acts of reproduction performed in the context of TDM and relevant to copyright law were sometimes privileged by the existing exceptions for personal use (for private and internal company purposes), as well as for temporary reproductions, and were thus permissible without the rightsholder’s consent. However, the consent of all affected rightsholders was required for all other uses of works or acts of reproduction for other purposes, such as the permanent storage of the data set. This always entailed a great deal of effort, high costs, difficulties in assessing the steps of the technical TDM process from a copyright standpoint and other legal uncertainties.
Regulation under the revised CopA
The principal goal of the comprehensive, newly introduced exception to copyright protection in the context of scientific research was to remove the aforementioned legal uncertainties existing in terms of the permissibility of TDM (and similar technologies) for research purposes under copyright law. The newly incorporated Article 24d CopA now expressly allows technical acts of reproductions (e.g. those performed via algorithms) for the purpose of scientific research, provided that the reproduced works have been lawfully accessed, as well as the storage of such reproductions for archiving and backup purposes once the research is complete. Consequently, such technical acts of reproduction are now lawful and royalty free even without the author’s consent. However, the reproduction of computer programs is excluded from this exception.
The new provisions cover both basic research and applied research. To avoid classification problems, the new statutory exception applies to both non-commercial and commercial research.
Regulation under the EU Directive
The statutory exceptions for the use of TDM were also put into concrete form at the EU level through Copyright Directive 2019/790, which came into force on 6 June 2019.
First, Art. 3 of the Directive allows TDM to be performed by research organisations that are non-profitmaking, re-invest all profits in their scientific research or operate in the public interest, as well as by cultural heritage institutions for research purposes, without the rightsholder’s consent. Second, Art. 4 allows TDM for any purpose, including purely commercial purposes, and thus goes beyond a mere exception for scientific purposes, but para. 3 limits the scope of these purposes such that the exception applies only if the respective rightsholder has not expressly prohibited TDM (reserved use).
Conclusion
Since Switzerland is such an important research centre, the new exception to copyright protection in the context of scientific research and the legal certainty it brings with it as regards TDM processes is a welcome change. Nevertheless, the issue of whether TDM processes for purposes other than scientific research are permissible under copyright law remains uncertain.
German version
Data Mining im revidierten Schweizer Urheberrecht
Mit den seit April geltenden neuen Urheberrechtsbestimmungen wurde eine Wissenschaftsschranke eingeführt und damit Rechtssicherheit für Data Mining in der wissenschaftlichen Forschung geschaffen.
Am 1. April 2020 sind die Änderungen im Schweizer Urheberrechtsgesetz (URG), welche die eidgenössischen Räte letzten September nach jahrelanger Vorarbeit verabschiedet hatten, in Kraft getreten. Die Gesetzesrevision zielte vor allem darauf ab, das URG an das Internetzeitalter anzupassen, wobei in verschiedenen Bereichen Kompromisslösungen erlassen wurden, um die divergierenden Interessen von Urhebern, Produzenten und Nutzern zu berücksichtigen.
Der vorliegende Beitrag befasst sich mit der im URG neu eingeführten sog. Wissenschaftsschranke und ihrer Anwendung im Bereich des Data Mining und dessen Unterform Text Mining, zusammen oft als Text & Data Mining (TDM) bezeichnet.
Grundlagen des Data Mining
TDM ist eine automatisierte computergestützte Methode zur Analyse grosser Text- oder Datenmengen (Big Data) und deren Vernetzung zur Entdeckung von Querbezügen, Zusammenhängen und Mustern und damit zur Gewinnung neuer Erkenntnisse. Während das eigentliche Data Mining der Analyse grosser strukturierter Datenmengen dient, wird das Text Mining auf unstrukturierte Textdateien angewendet.
Aufgrund der immensen im Internet verfügbaren Text- und Datenmengen hat sich TDM zu einem Standardverfahren entwickelt und wird heute zu unterschiedlichsten Zwecken eingesetzt, sowohl in wissenschaftlichen Forschungsbereichen wie in der Pharmaindustrie und der Biomedizin als auch ausserhalb der Forschung, etwa im Marketing oder im Journalismus. Ausserdem kommt TDM bei der Entwicklung von auf künstlicher Intelligenz basierenden Applikationen zum Einsatz.
Urheberrechtliche Relevanz
Im Rahmen von TDM-Verfahren wird in der Regel als erstes ein Datensatz erstellt, auf den sodann die TDM-Software zu dessen Analyse angewendet wird. Regelmässig werden dabei Daten kopiert und gespeichert.
Sofern die genutzten Daten Werke im Sinne des Urheberrechts involvieren (z.B. wissenschaftliche oder technische Texte, Bilder, audiovisuelle Medien oder Datensammlungen), handelt es sich bei diesem Vorgang um urheberrechtliche Vervielfältigungshandlungen, etwa durch die dauerhafte Speicherung der Werke im Datensatz, durch Umformatierungen der im Datensatz enthaltenen Werke oder durch deren vorübergehende Speicherung im Rahmen der Analyse. Solche Vervielfältigungshandlungen stellen ohne Einwilligung des Urhebers oder ohne gesetzliche Schrankenbestimmungen eine Urheberrechtsverletzung dar.
Urheberrechtliche Regelung
Bisherige Regelung in der Schweiz
Das URG enthielt vor der Revision weder eine Ausnahme vom Ausschliesslichkeitsrecht des Urhebers zugunsten der wissenschaftlichen Forschung (Wissenschaftsschranke) noch spezifische Bestimmungen zu TDM.
Die im Rahmen von TDM vorgenommenen urheberrechtlich relevanten Vervielfältigungshandlungen konnten zwar teilweise durch die bestehenden Schranken zum Eigengebrauch (für private und betriebsinterne Zwecke) sowie für vorübergehende Vervielfältigungen privilegiert und damit ohne Einwilligung der Rechteinhaber gerechtfertigt werden. Für alle anderen Werknutzungen bzw. Vervielfältigungen zu anderen Zwecken, wie bspw. das permanente Speichern des Datensatzes, war jedoch die Einwilligung aller betroffenen Rechteinhaber erforderlich. Dies war stets mit grossem Aufwand, hohen Kosten, Schwierigkeiten bei der urheberrechtlichen Beurteilung von technischen TDM-Prozessschritten und anderen Rechtsunsicherheiten verbunden.
Regelung gemäss revidiertem URG
Ziel der neu eingeführten, umfassenden Wissenschaftsschranke war vor allem die Beseitigung der erwähnten rechtlichen Unsicherheiten im Zusammenhang mit der urheberrechtlichen Zulässigkeit von TDM (und vergleichbaren Technologien) zu Forschungszwecken. Der neu eingefügte Artikel 24d URG erlaubt nun ausdrücklich technisch bedingte (z.B. mittels Algorithmen) Vervielfältigungshandlungen zum Zweck der wissenschaftlichen Forschung, sofern zu den vervielfältigten Werken ein rechtmässiger Zugang besteht, sowie die Aufbewahrung solcher Vervielfältigungen zu Archivierungs- und Sicherungszwecken nach Forschungsabschluss. Derartige technisch bedingten Vervielfältigungshandlungen sind somit neu auch ohne Zustimmung des Urhebers zulässig und zudem vergütungsfrei. Ausgenommen von dieser Wissenschaftsschranke ist die Vervielfältigung von Computerprogrammen.
Die neue Regelung umfasst sowohl die Grundlagenforschung als auch die angewandte Forschung. Um Abgrenzungsprobleme zu vermeiden, gilt die neue Schrankenbestimmung zudem sowohl für die nicht-kommerzielle als auch die kommerzielle Forschung.
Regelung gemäss EU-Richtlinie
Auch auf EU-Ebene wurden durch die am 6. Juni 2019 in Kraft getretene Urheberrechtsrichtlinie 2019/790 die Schrankenbestimmungen für den Einsatz von TDM konkretisiert.
Einerseits erlaubt Art. 3 der Richtlinie TDM ohne Einwilligung des Rechteinhabers durch Forschungsorganisationen, die nicht gewinnorientiert sind, die alle Gewinne in ihre wissenschaftliche Forschung reinvestieren oder die im öffentlichen Interesse tätig sind, sowie durch Einrichtungen des Kulturerbes für Forschungszwecke. Andererseits ermöglicht Art. 4 TDM gar für jegliche – somit auch rein kommerzielle – Zwecke und geht damit über eine blosse Wissenschaftsschranke hinaus, schränkt deren Anwendungsbereich jedoch in seinem Abs. 3 dahingehend wieder ein, dass die Schranke nur anwendbar ist, wenn der jeweils betroffene Rechteinhaber TDM nicht ausdrücklich untersagt hat (Nutzungsvorbehalt).
Fazit
Angesichts der grossen Bedeutung des Forschungsstandortes Schweiz ist die neu eingeführte Wissenschaftsschranke und die dadurch erhöhte Rechtssicherheit in Bezug auf TDM-Verfahren zu begrüssen. Gleichzeitig bleiben die Unsicherheiten in Bezug auf die urheberrechtliche Zulässigkeit von TDM-Verfahren für andere Zwecke als die Forschung weiterhin bestehen.