Zugang zu Forschungsdaten in Gefahr: Ein aktuelles Beispiel aus der Infektionsbiologie

Foto: ii-graphics/stock.adobe.com

Grundlagenforschung ist auf den freien Zugang zu Forschungsdaten angewiesen. Dieser Zugang ist gefährdet: Erste Datenbanken sind bereits kostenpflichtig, zum Beispiel die VEuPathDB (The Eukaryotic Pathogen, Vector, and Host Informatics Resources) .

Unterhaltung, Pflege und Weiterentwicklung von Forschungsdatenbanken kosten viel Geld, das bislang dank weniger großer Förderer zur Verfügung stand. Heute ist die Zukunft vieler Repositorien allerdings ungewiss. Die Betreiber der Datenbanken beginnen bereits damit, hohe Nutzungsgebühren einzuführen. Finanzmittel, die nicht eingeplant und für viele Forscher/-innen aus den Ländern des globalen Südens auch gar nicht leistbar sind. Am Beispiel der Datenbank VEuPathDB (The Eukaryotic Pathogen, Vector, and Host Informatics Resources) werden die Konsequenzen des Verlusts von freiem Zugang zu Daten deutlich.

Wäre das Browsen im Internet, die Nutzung von Suchmaschinen und eingebauten KI-Tools plötzlich zahlungspflichtig, hätte das bei vielen Menschen einen massiven Einfluss auf die tägliche Arbeit und die Produktivität. „Genau dieses Szenario zeichnet sich gerade in Hinblick auf spezialisierte wissenschaftliche Datenbanken ab – die Entwicklungen bei der vor allem in der Infektionsbiologie genutzten Datenbank VEuPathDB sind da nur ein Beispiel“, darauf weist Prof. Markus Engstler, jüngst gewählter Präsident des Verbandes Biologie, Biowissenschaften und Biomedizin in Deutschland e.V. (VBIO), aus aktuellem Anlass hin.

Forschung lebt vom freien Zugang zu Datensammlungen

Biowissenschaftliche Forschung benötigt Zugang zu einer Vielzahl von speziellen Datensammlungen. Die dort gesammelten Daten sind allesamt Forschungsergebnisse, die über lange Zeiträume hinweg erhoben, annotiert und in Datenbanken öffentlich zugänglich gemacht wurden. Tatsächlich sind Publikationen ohne Veröffentlichung der zu Grunde liegenden experimentellen Datensätze heute quasi nicht mehr möglich. In den Datenbanken liegen also Schätze – wissenschaftliche Ergebnisse, auf denen alle künftige Forschung aufbaut.

Beispiele solcher unverzichtbaren Ressourcen sind die großen biologischen Datenbanken; etwa die Sammlungen genetischer und biochemischer Daten, die seit Beginn der Molekularbiologie vor über 50 Jahren aufgebaut wurden. Die Protein Data Bank (PDB) etwa versammelt alle verfügbaren Strukturdaten von Proteinen. Nur mit Hilfe dieser dort über Jahrzehnte gepflegten Datensätze konnte eine bahnbrechende KI wie AlphaFold trainiert werden – eine Leistung, die soeben mit dem Nobelpreis ausgezeichnet wurde.

Im Bereich der eukaryotischen Pathogene, Vektoren und Wirtsinformationen ist die relevante Datenbank VEuPathDB. Sie stellt sicher, dass genomische und andere umfangreiche Datensätze für die weltweite Gemeinschaft der biomedizinischen Forscher zugänglich, durchsuchbar und mit ständig neuen Algorithmen analysierbar sind. Sie liefert damit entscheidende Informationen über Erreger von Infektionskrankheiten, einschließlich ihrer Interaktion mit Säugetierwirten und Krankheitsüberträgern, wie z. B. blutsaugenden Mücken und Fliegen. Die Grundlagenforschung an großen Infektionskrankheiten mit Millionen Krankheitsfällen wie beispielsweise Malaria oder Chagas-Fieber ist auf den offenen und freien Zugang zu den in dieser Datenbank hinterlegten Daten angewiesen.

VEuPathDB: NIH hat sich aus der Förderung zurückgezogen

Doch die Finanzierung von VEuPathDB ist in Gefahr, da sich die US-amerikanischen National Institutes of Health (NIH), bisher maßgeblicher Förderer, aus der Förderung zurückgezogen hat. Vor wenigen Wochen wurde ein „freiwilliges Bezahlmodell“ eingeführt, das den Fortbestand der Datenbank kurzfristig sichern soll. Das bedeutet für ein durchschnittlich großes Labor nach Angaben des VDBIO Kosten von bis zu mehreren tausend Euro pro Jahr. Finanzielle Mittel, die so nicht eingeplant und für viele Forscher/-innen aus den Ländern des globalen Südens so gar nicht leistbar sind.

Wenn ein wissenschaftliches Fachgebiet seine spezialisierten Datenbanken – hier die VEuPathDB – verliere, werde seine Produktivität umgehend und drastisch eingeschränkt, wie der VBIO betont. Der Verband weist auch auf die Folgen hin: Das Forschungsfeld verliert massiv an Attraktivität. Der wissenschaftliche Nachwuchs wird auf der Suche nach zukunftsträchtigeren und produktiveren Forschungsfelder kurzfristig abwandern und das Fachgebiet mittelfristig verschwinden. Dies wäre vor allem für Forschungsfelder wie die Infektionsbiologie oder Parasitologie fatal, die die Grundlagen liefern, um zum Beispiel den Herausforderungen von One Health und Pandemieprävention zu begegnen.

Es bestehe also kurzfristiger Handlungsbedarf, denn die erforderlichen Mittel müssten zeitnah zur Verfügung gestellt werden, so der VBIO weiter. Eine zeitlich befristete Aussetzung der Pflege der Datenbanken ist dabei keine Option, da der Datenbestand ständig wächst und die Datenbank selbst technisch angepasst werden müssen: „Ist das entsprechende personelle Know-how erst einmal verloren, ist die Wiederherstellung einer einmal abgeschalteten Datenbank kaum noch möglich – und kostet deutlich mehr als der Erhalt der bestehenden Datenbank“, erläutert Engstler.

„Das drohende Schicksal der VEuPathDB ist hier nur ein aktuelles Beispiel für die Herausforderungen, die auf die Biowissenschaften zukommen. Es ist dringend Zeit, dass die Naturwissenschaften sich der Gefahr bewusst werden und dass die Politik die Instrumente schafft, wissenschaftliche Datenbanken unangreifbar und resilient zu machen“, warnt der VBIO.