Wie Forschungsdaten FAIR werden

Wie sich Forschungsdaten Schritt für Schritt FAIR aufbereiten lassen – also auffindbar, zugänglich, interoperabel und wiederverwendbar –, zeigen Forschende des Deutschen Zentrums für Diabetesforschung (DZD) und der Universitätsmedizin Greifswald in einer neuen Publikation.

In der klinischen Forschung entstehen umfangreiche und vielfältige Daten – etwa zu Blutwerten, Körpermaßen oder Vorerkrankungen. Ihr volles Potenzial entfalten diese Daten jedoch nur, wenn sie auffindbar, zugänglich, interoperabel und wiederverwendbar sind. Diese Eigenschaften werden durch die FAIR-Prinzipienfindable, accessible, interoperable, reusable – beschrieben. Damit bildet „FAIRification“ die Grundlage für eine nachhaltige Nutzung klinischer Forschungsdaten.

Das DZD arbeitet daher intensiv daran, Daten aus der Diabetesforschung bundesweit zu standardisieren und auch für andere medizinische Fragestellungen nutzbar zu machen. Am Beispiel des DZD Basisdatensatzes vergleichen die Forschenden unterschiedliche FAIRification-Workflows, bewerten ihre Stärken und Herausforderungen und geben konkrete Empfehlungen für die wissenschaftliche Community.

Der Weg zu FAIRen Forschungsdaten

Doch welche Arbeitsschritte sind nötig, um Daten FAIR aufzubereiten? Das DZD hat mit seinem Basisdatensatz für Diabetes- und Metabolismusforschung einen wichtigen Schritt in Richtung FAIRification gemacht. Unter einer offenen Lizenz werden im DZD Basisdatensatz zentrale Parameter der klinischen Diabetesforschung interoperabel für die nationale und internationale Nachnutzung zur Verfügung gestellt.

Um weiteren Forschenden den Weg zu FAIRen Daten zu erleichtern, hat das DZD in Zusammenarbeit mit der Universitätsmedizin Greifswald unterschiedliche Arbeitsabläufe zur FAIRification von Daten am Beispiel des DZD Basisdatensatzes systematisch beschrieben und verglichen. In der Studie leiten sie Mindestanforderungen ab, die Aufwand und Kosten reduzieren können. Die Autor*innen beschreiben, wie FAIRifizierung effizienter gestaltet werden kann und wo zukünftige Optimierungen möglich sind. Viele der gewonnenen Erkenntnisse sind auch auf andere klinische Datensätze übertragbar.

FAIRifikation von Beginn an planen

„Da die nachträgliche FAIRification sehr aufwendig ist, sollten Forschungsprojekte stets bereits von Anfang an FAIR geplant werden – inklusive Infrastruktur und klar abgestimmter Prozesse zwischen allen Beteiligten“, betont Dr. Lars Oest, Leiter Bioinformatik und Datenmanagement am DZD. Zur Automatisierung semantischer Anreicherung und zur Integration prospektiver Data-Management-Pläne bedarf es jedoch weiterer Forschung.