Zugang zu und Nachnutzung von wissenschaftlicher Software
Positionspapier des Arbeitskreises Open Science der Helmholtz-Gemeinschaft, März 2017
1. Relevanz
Mit der voranschreitenden Digitalisierung von Forschung und Lehre steigt an wissenschaftlichen Einrichtungen die Zahl an Software-Lösungen, die zur Verarbeitung von Forschungsdaten genutzt werden. Mit wissenschaftlicher Software ist in diesem Kontext Programmcode gemeint, der im Rahmen einer wissenschaftsbezogenen Tätigkeit entwickelt und/oder nachgenutzt wird. Die unter dem Stichwort Open Science2 geforderte Verifizierbarkeit und Reproduzierbarkeit von wissenschaftlichen Ergebnissen kann in vielen Fachgebieten nur sichergestellt werden, wenn neben den Forschungsdaten auch dokumentierter und nachvollziehbarer Programmcode offen zugänglich gemacht wird. Der Zugang zu und die Nachnutzung von wissenschaftlicher Software (Open Research Software) sind somit, neben offenem Zugang zu Publikationen (Open Access) und Forschungsdaten (Open Research Data), ein essenzielles Element von Open Science. Die Zugänglichmachung von Forschungsdaten wurde in den letzten Jahren mit neuen Verfahren erfolgreich realisiert. Diese Entwicklung steht im Bereich der wissenschaftlichen Software noch am Anfang. Die Diskussion über den zeitgemäßen Umgang mit wissenschaftlicher Software hat deutlich an Relevanz gewonnen. Beiträge in Nature3 und Science4 sowie diverse übergreifende Initiativen5, fachliche Ansätze6 und sich entwickelnde Publikationsstrategien7 belegen die Notwendigkeit einer Veränderung bestehender Abläufe. Förderorganisationen wie z. B. die Europäische Kommission im Rahmen des Open Research Data Pilots in HORIZON 2020 fordern neben dem offenen Zugang zu Forschungsdaten eines geförderten Projekts auch die öffentliche Bereitstellung der verwendeten Software.8 Weiter wird wissenschaftliche Software im Bereich des Berichtswesens9 vermehrt in den Blick genommen.
2. Diskussion in der Helmholtz-Gemeinschaft
Der Arbeitskreis Open Science der Helmholtz-Gemeinschaft hat im April 2016 eine Task Group zur Behandlung dieses Themenfeldes eingesetzt. Diese hat im November 2016 den zweitägigen Helmholtz Open Science Workshop „Zugang zu und Nachnutzung von wissenschaftlicher Software“10 veranstaltet, an dem Vertreterinnen und Vertreter aus Forschung, Informationsinfrastruktur und Verwaltung wissenschaftlicher Einrichtungen in Deutschland teilgenommen haben. Neben Keynotes und Impulsvorträgen wurden auf dem Workshop in thematisch fokussierten Sessions Problemstellungen, Herausforderungen, Lösungsansätze und Handlungsempfehlungen zu folgenden Themenfeldern diskutiert:
- Technische Infrastrukturen
- Standards und Qualitätssicherung
- Reproduzierbarkeit
- Lizenzierung und weitere rechtliche Aspekte
- Zitation und Anerkennung
- Sichtbarkeit und Modularität
- Geschäftsmodelle
- Personal, Ausbildung, Karrierewege
Mit dem Workshop hat die Helmholtz-Gemeinschaft einen Impuls gegeben für den nationalen Austausch und die Vernetzung von Akteuren für gemeinsame Aktivitäten in diesen Themenbereichen. Die Ergebnisse des Workshops sind in einem Report zusammengefasst.11 Um den weiteren Dialog zu fördern, wurde eine öffentliche Mailingliste eingerichtet.12
3. Diskussion in der Allianz der deutschen Wissenschaftsorganisationen
Um die Diskussion zu diesem Themenfeld in Deutschland zu fördern und sicherzustellen, dass die Wissenschaftsorganisationen eine abgestimmte und in internationale Entwicklungen eingebettete Position zu diesem Handlungsfeld entwickeln, wurde auf Vorschlag der Helmholtz-Gemeinschaft im Rahmen der Schwerpunktinitiative „Digitale Information“ der Allianz der deutschen Wissenschaftsorganisationen die Ad-hoc-Arbeitsgruppe „Wissenschaftliche Software“ ins Leben gerufen. Aufgabenfelder der Arbeitsgruppe sind:
- Abstimmung und organisationsübergreifender Dialog
- Begleitung und Förderung der Diskussion zum Thema in Deutschland
- Unterstützung von Initiativen für Open-Source-Softwarelösungen, die ein großes Potential für die wissenschaftliche Community haben
- Formulierung von Empfehlungen zur guten wissenschaftlichen Praxis im Umgang mit wissenschaftlicher Software
- Vernetzung mit internationalen Initiativen
Die in diesem Positionspapier festgehaltenen Helmholtz-spezifischen Punkte, sowie darüber hinaus gehende Analysen und Empfehlungen im Report des Helmholtz Open Science Workshops „Zugang zu und Nachnutzung von wissenschaftlicher Software”, können hier als Arbeitsgrundlage eingebracht werden.
4. Empfehlungen
Im folgenden Abschnitt dieses Papiers werden an Hand der Themen Leit- und Richtlinien, Anreize, Publikationsstrategien, Infrastrukturen, Ausbildung, und rechtliche Fragen mögliche Lösungsansätze vorgestellt und Empfehlungen für die Gestaltung des Umgangs mit wissenschaftlicher Software an den Zentren der Helmholtz-Gemeinschaft gegeben.
4.1 Leit- und Richtlinien
Leitfrage: Wie kann das Thema angemessen in Policies von wissenschaftlichen Institutionen, Förderorganisationen und Journals integriert werden? Der nachhaltige Umgang mit wissenschaftlicher Software bedarf klarer Regeln. Leit- und Richtlinien helfen die Qualität, Zugänglichkeit und Nachnutzung zu sichern, offene Fragen bei der Verwertung zu klären, die Verwendung von standardisierten Lizenzen zu sichern und die Anwendung von Zitationsstandards zu garantieren. Die Entwicklung solcher Leit- und Richtlinien mit den relevanten Akteuren leistet einen Beitrag zur Schaffung eines gemeinsamen Verständnisses über den Umgang mit Software an wissenschaftlichen Einrichtungen. Ein solcher Prozess hilft auch der vermehrten Forderung von Drittmittelgebern nach Zugänglichkeit von wissenschaftlicher Software zu entsprechen und einzelne Forschende zu entlasten, indem z. B. Muster für „Software Management Plans“ bereitgestellt werden. Den Zentren wird empfohlen, mit relevanten Akteuren aus Wissenschaft, Informationsinfrastruktur, Wissens- und Technologietransfer und Rechtsabteilungen Leit- und Richtlinien zum Umgang mit wissenschaftlicher Software zu entwickeln. Diese sollten den gesamten Lebenszyklus wissenschaftlicher Software erfassen und insbesondere Aussagen zu folgenden Bereichen enthalten: Softwareentwicklungs- und Dokumentationspraxis; Lizenzierung, Zugänglichmachung und Archivierung von Code; Publikations- und Transferstrategien; Zitationsmodalitäten; Forschungsinfrastruktur; Empfehlungen zur Qualitätssicherung der Software.
4.2 Anreize
Leitfragen: Wie kann die Erstellung und Nutzung von Open-Source-Software für die Wissenschaft stimuliert werden? Wie können Forschende bei der Zugänglichmachung von wissenschaftlicher Software unterstützt werden? Wie kann das Thema im Berichtswesen sowie im Reputationssystem verankert werden? Welche Zitationsverfahren können entwickelt werden? Die Entwicklung und Dokumentation von wissenschaftlicher Software wird im Wissen-schaftssystem nur selten als Forschungsleistung anerkannt. Diese Praxis führt dazu, dass es keine Anreize für die Zugänglichmachung von Software gibt.
Die Veröffentlichung von Programmcode sollte – zusätzlich zu textuellen Artikeln und Forschungsdatenpublikationen – als eigenständiges Produkt des Forschungsprozesses anerkannt werden. Hierzu ist es von großer Bedeutung, dass Publikationsstrategien und Zitationsstandards für wissenschaftliche Software etabliert werden. Die Arbeit von Software-Entwicklerinnen und -Entwicklern in der Wissenschaft sollte für Evaluierungen erfasst und anerkannt werden.
Den Zentren wird empfohlen die intellektuelle Leistung bei der Entwicklung von wissen-schaftlicher Software als Forschungsleistung anzuerkennen, indem Software in Publikationsdatenbanken als eigenständiger Publikationstyp gewürdigt und durch adäquate, trans-parente Metriken erfasst wird.
4.3 Publikationsstrategien
Leitfrage: Wie kann das erfolgreiche Zusammenspiel von Software-Repositorien, Journals und weiteren Informationsinfrastrukturen sichergestellt werden? Die Entwicklung wissenschaftlicher Software ist ein wichtiger Teil der Forschungsleistung in der digital arbeitenden Wissenschaft. Der aktuelle Umgang mit wissenschaftlicher Software wird der Bedeutung von Software in Bezug auf Nachvollziehbarkeit und Reproduzierbarkeit von Forschungsergebnissen häufig nicht gerecht. Nur selten wird Software als eigenständiger Publikationstyp anerkannt. Diese Praxis führt dazu, dass weder die Leistung der Forschenden bei der Programmierung anerkannt wird, noch feste Abläufe bei der Prüfung auf Verwertung existieren.
Den Zentren wird empfohlen Publikationsstrategien für wissenschaftliche Software zu entwickeln. Definierte Workflows und klare Verantwortlichkeiten können sicherstellen, dass wissenschaftliche Software, als Open Source auf einer vertrauenswürdigen Infrastruktur veröffentlicht wird, wenn dem keine Verwertungsoptionen entgegenstehen.
Es sollte sichergestellt werden, dass Software (zum Beispiel mit Hilfe von persistenten Identifikatoren wie dem Digital Object Identifier - DOI) dauerhaft zitierbar und zugänglich ist und durch geeignete Review-Verfahren die notwendige Qualität für Nachvollziehbarkeit, Reproduzierbarkeit und ihre Nachnutzbarkeit gewährleistet wird. Um den Wettbewerbsvorteil der Zentren, an denen die Software entwickelt wird, zu wahren, sind bei der Publikation von Software auch angemessene Embargofristen denkbar.
Im Dialog mit Verlagen und Journals sollte darauf hingewirkt werden, dass Software angemessen zitiert wird, so dass z. B. die korrekte Referenzierung von Softwareversionen gewährleistet wird, aber auch der Einsatz einer Software versionsübergreifend nachvollzogen werden kann.
4.4 Infrastrukturen
Leitfrage: Was sind geeignete Repositorien zur dauerhaften Speicherung und aktiver Bereit-stellung von wissenschaftlicher Software? Infrastrukturen, wie kollaborative Plattformen zur Softwareentwicklung oder Repositorien zur längerfristigen Speicherung von Softwarelösungen, sind das technologische und organisatorische Fundament für den Zugang zu und die Nachnutzung von wissenschaftlicher Software sowie für ihre Nachhaltigkeit. Ihre Nutzung stellt sicher, dass Programmcode und Dokumentation, unabhängig von Personalwechseln, langfristig an einer wissenschaftlichen Einrichtung oder innerhalb einer Fach-Community gesichert werden.
In der Praxis werden häufig frei verfügbare Dienste kommerzieller Anbieter zur Softwareentwicklung verwendet. Dies kann zu Abhängigkeiten führen, die sich längerfristig negativ auf die Wissenschaft auswirken können. Darüber hinaus fehlen im Bereich der Repositorien zur längerfristigen Speicherung des Programmcodes verlässliche und vertrauenswürdige Infrastrukturen, die die Publikation von Software als zitierbares Produkt des wissenschaftlichen Erkenntnisprozesses ermöglichen.
Den Zentren wird empfohlen, sich dieser Herausforderungen anzunehmen und Strategien zu entwickeln, die gewährleisten, dass wissenschaftliche Software auf vertrauenswürdigen Infrastrukturen, wie z. B. Repositorien, entwickelt und langfristig gespeichert wird. Darüber hinaus sollten Plattformen zur kollaborativen Softwareentwicklung empfohlen oder bereitgestellt werden, die sicherstellen, dass die Zentren die Autonomie über Softwareentwicklungen behalten und sich nicht in Abhängigkeit zu kommerziellen Dienstleistern begeben. Dabei ist insbesondere auch organisationsübergreifende Zusammenarbeit wünschenswert.
Bei der Bereitstellung eigener Infrastrukturen sollte auf eine nachhaltige Personalpolitik geachtet werden, die sicherstellt, dass das Know-how der technischen Mitarbeiterinnen und Mitarbeiter zum Betrieb der Infrastrukturen und zur Unterstützung der Forschenden längerfristig an den Zentren gehalten wird.
4.5 Aus- und Weiterbildung
Leitfragen: Wie kann die Softwareentwicklung in der Forschung professionalisiert werden? Welche Aus- und Weiterbildungsverfahren werden benötigt? Exzellente Wissenschaft bedarf im digitalen Zeitalter sehr gut ausgebildeter Entwicklerinnen und Entwickler. Während in der Wirtschaft mit Rekrutierungsmaßnahmen, hohen Gehältern und Maßnahmen der Personalentwicklung um die besten Köpfe geworben wird, bieten wissenschaftliche Einrichtungen Entwicklerinnen und Entwicklern zu selten verlässliche Karrierewege. Hier gilt es gegenzusteuern. Wissenschaftliche Einrichtungen sollten dem Fachpersonal längerfristige Perspektiven bieten.
Es gilt klare Stellenformate zu schaffen und die Softwareentwicklung in der Wissenschaft zu professionalisieren. Dazu ist es auch notwendig Programmierkenntnisse möglichst früh in der Ausbildung von Fachwissenschaftlerinnen und -wissenschaftlern zu verankern, wodurch auch die Kommunikationsfähigkeit zwischen Entwicklerinnen und Entwicklern und Fachwissenschaftlerinnen und -wissenschaftlern gestärkt wird.
Den Zentren wird empfohlen dieses Handlungsfeld im Dialog mit Hochschulpartnern zu thematisieren und in den Zentren Ausbildungs- und Karrierewege für Entwicklerinnen und Entwickler zu etablieren. Darüber hinaus sollten interne Aus- und Weiterbildungsmaßnahmen gestärkt werden, um die Personalentwicklung von exzellenten Entwicklerinnen und Entwicklern zu fördern.
4.6 Rechtliche Fragen
Leitfragen: Welche Lizenzen stellen Urheberschaft und Nachnutzung der Software in einem rechtlich abgesicherten Rahmen sicher? Vor einer Veröffentlichung der Software gilt es, den Programmcode auf Abhängigkeiten und Verwertbarkeit zu prüfen. Wird auf eine Publikation der Software als Open Source gesetzt, ist eine adäquate Lizenzierung des Programmcodes nötig. Im Wissenschaftsbetrieb mangelt es oft an Kenntnissen über geeignete Lizenzen für Software und deren Implikationen. Diese Unklarheiten gilt es auszuräumen. Informationsinfrastruktur und Administration sollten Forschende bei der Lizenzierung von Software durch Empfehlungen, Best Practices und klar definierte Prozesse unterstützen.
Den Zentren wird empfohlen Prozesse zu etablieren, die sicherstellen, dass Software, die zur Veröffentlichung vorgesehen ist, durch standardisierte Lizenzen rechtlich abgesichert veröffentlicht wird.
5. Schlussbemerkung
Mit diesem Positionspapier gibt der Arbeitskreis Open Science der Helmholtz-Gemeinschaft einen Impuls für die Gestaltung des Umgangs mit wissenschaftlicher Software, insbesondere in Bezug auf Leit- und Richtlinien, Anreize, Publikationsstrategien, Infrastrukturen, Ausbildung, sowie rechtliche Fragen. Die im Positionspapier allgemein formulierten Empfehlungen können als Grundlage für die Erarbeitung von Empfehlungen zur Implementierung von Leit- und Richtlinien für wissenschaftliche Software an den Zentren dienen.
Referenzen
Die Referenzen wurden für die Webdarstellung angepasst und, wo möglich, nicht mehr funktionierende Verlinkungen korrigiert. Zusätzliche Ergänzungen sind gekennzeichnet angegeben. Diese redaktionellen Überarbeitungen sind im veröffentlichten PDF-Dokument des Positionspapiers nicht vorhanden. Stand: 07.08.2024
1Dieses Positionspapier wurde von der Task Group „Zugang zu und Nachnutzung von wissenschaftlicher Software“ des Arbeitskreises Open Science der Helmholtz-Gemeinschaft erarbeitet und vom Arbeitskreis Open Science am 14.03.2017 verabschiedet.
2Helmholtz-Gemeinschaft (2015). Open Science – Chancen, Herausforderungen und Handlungsfelder. Ergänzung: Die äquivalenten aktuellen Seiten sind hier zu finden.
3z. B.: Barnes, N. (2010). Publish your computer code: it is good enough. Nature, 467(7317), 753–753; und Ince, D. C., Hatton, L., & Graham-Cumming, J. (2012). The case for open computer programs. Nature, 482(7386), 485–488.
4z. B.: Morin, A., Urban, J., Adams, P. D., Foster, I., Sali, A., Baker, D., & Sliz, P. (2012). Shining Light into Black Boxes. Science, 336(6078), 159–160; Peng, R. D. (2011). Reproducible Research in Computational Science. Science, 334(6060), 1226–1227.
5z. B.: Mozilla Science Lab (USA), SciForge (DE), Software Sustainability Institute (UK), Run My Code (International), rOpenSci.
6z. B.: Bioconductor in in der Biomedizin oder Open Source Geospatial Foundation in den Geowissenschaften.
7z. B.: Software-Journale wie Open Research Software – JORS (Ubiquity Press) oder SoftwareX (Elsevier) und die Kooperationen zwischen GitHub und Zenodo sowie zwischen GitHub und Figshare.
8siehe dazu: Guidelines on Open Access to Scientific Publications and Research Data in Horizon 2020. Version 1.0. 11 December 2013.
9In der Beta-Version des „Kerndatensatz Forschung“ wird die Erfassung von Software unter ID „Pu45“ empfohlen. Ergänzung: Die Webressource zur Beta-Version ist nicht mehr verfügbar. In der veröffentlichten Version des Kerndatensatz Forschung ist dies jedoch gleich geblieben, in der aktuellen Version 1.3 findet sich der genannte Aspekt unter genannter ID.
10 (entfallen) Ergänzung: Die Details zum Workshop sind im Report zu finden, vgl. nachfolgende Referenz 11.