Bioinformatikprojekt erschließt verborgene Datenschätze23. September 2021 Diagram concept with Bioinformatics text and keywords. EPS 10 isolated on white background Die Proteinforschung erzeugt riesige Datenmengen, die in internationalen Datenbanken gesammelt werden. Die darin vorhandenen Informationen sind teils noch nicht ausgewertet und somit versteckt und bei Suchen nicht auffindbar. Das will ein Team um Dr. Julian Uszkoreit und Dr. Michael Turewicz vom Zentrum für Proteindiagnostik Prodi und dem Medizinischen Proteomcenter der Ruhr-Universität Bochum (RUB) ändern. Sie planen eine automatisierte Reanalyse der eingespeisten Daten. Das von ihnen geleitete Projekt „Increasing the translational value of public proteomics datasets: Automatic metadata-driven reanalysis in cloud infrastructures” wird für zwei Jahre von ELIXIR gefördert. ELIXIR ist ein europäisches Bioinformatik-Netzwerk, das die Daten aus öffentlich geförderten Forschungsprojekten der Lebenswissenschaften und die entsprechenden Datenbanken managt, sowie eine große internationale Plattform für viele andere Bioinformatik-Services und -Kooperationen darstellt. Das Projekt startet mit einem Kick-Off-Meeting am 24. September 2021. Daten unter neuen Aspekten auswerten Daten, die in der Massenspektrometrie-basierten Proteinforschung weltweit gewonnen werden, werden in internationalen Datenbanken gesammelt. Jeder Datensatz wird dafür nach bestimmten Standards aufbereitet und mit einer Beschreibung versehen, die zum Beispiel Auskunft darüber gibt, von welchem Organismus das Protein stammt, mit welchem Gerät die Daten gewonnen wurden und welche Einstellungen daran vorgenommen wurden. So können auch andere Forschende auf die Information zugreifen und für eigene Arbeiten nutzen. „Allerdings ist es oft so, dass man nur finden kann, wonach man sucht“, sagt Uszkoreit. Die Datensätze beinhalten weit mehr Informationen, als man zurzeit auswerten kann. Das Team des Projekts will es daher ermöglichen, eine automatisierte Reanalyse aller in die Datenbank eingespeisten Datensätze vorzunehmen, um auch schlummernde Informationen nutzbar zu machen. „Kommt eine neue Analysetechnik auf den Markt oder werden neue Entdeckungen veröffentlicht, kann man die vorhandenen Daten sozusagen mit einer neuen Brille betrachten und unter neuen Aspekten auswerten“, erklärt er. „Das kann auch automatisiert durch Cloud-Technologie geschehen.“ „Damit ist dieses Projekt ein Beispiel dafür, wie ein gutes Management von Forschungsdaten und moderne IT-Technologien zu neuen oder verbesserten Forschungsergebnissen führen können“, so Turewicz.
Mehr erfahren zu: "Genetischer Risikofaktor und Virusinfektion tragen gemeinsam zur Multiplen Sklerose bei" Genetischer Risikofaktor und Virusinfektion tragen gemeinsam zur Multiplen Sklerose bei Multiple Sklerose wird durch eine Infektion mit dem Epstein-Barr-Virus mitverursacht. Daneben spielen aber auch bestimmte Genvarianten eine wichtige Rolle. Wie Forschende der Universität Zürich zeigen, führt erst das molekulare Zusammenspiel […]
Mehr erfahren zu: "2000 Jahre alte Herpesviren im menschlichen Genom" 2000 Jahre alte Herpesviren im menschlichen Genom Eine neue Studie bestätigt, dass bestimmte humane Herpesviren bereits vor tausenden Jahren Teil des menschlichen Genoms wurden. Die aktuellen Genomdaten liefern den ersten direkten Beweis für die Entwicklung der Viren […]
Mehr erfahren zu: "Darmpolypen: DNA-Tests verbessern den Einblick in erbliche Risiken" Darmpolypen: DNA-Tests verbessern den Einblick in erbliche Risiken Bei fünf bis zehn Prozent der Darmkrebspatienten spielen erbliche Faktoren eine Rolle. Dabei ist der Anteil bei jüngeren Personen höher. Die DNA-Analyse von Darmpolypen liefert wichtige zusätzliche Informationen über die […]