Profiling für Zellen5. August 2022 Bild: © ivector – stock.adobe.com Einzelzellanalysen liefern eine Fülle molekularer und genetischer Informationen. Mit Hilfe des maschinellen Lernens führt ein Team um MDC-Forscher Uwe Ohler diese Daten zusammen und erstellt aussagekräftige Profile der Zellen. Die Chan Zuckerberg Initiative (CZI) fördert das Projekt nun. Mit unterschiedlichen Techniken lassen sich heute die Eigenschaften und Zustände von Zellen in einem nie erreichtem Detailreichtum charakterisieren. So können Wissenschaftler etwa die DNA und ihre zugehörigen Genschalter auslesen, die RNA analysieren oder die unterschiedlichen Proteine und ihre Formen ermitteln. Das Problem dabei: man hat am Ende riesige Datenmengen, die vollkommen unterschiedliche Aspekte der Zelle beschreiben. Und selbst wenn es sich eigentlich um die gleichen Informationen vom gleichen Zelltyp handelt, unterscheiden sich die Daten voneinander – abhängig davon, in welchem Labor, zu welchem Zeitpunkt und mit welcher Technik sie gewonnen wurden. Ein Modell der Zelle Die Arbeitsgruppe „Computational Regulatory Genomics“ von Professor Uwe Ohler am Berliner Institut für Medizinische Systembiologie (BIMSB), das zum Max-Delbrück-Centrum für Molekulare Medizin in der Helmholtz-Gemeinschaft (MDC) gehört, will Abhilfe schaffen. Das Team arbeitet an computergestützten Methoden, die diese Daten automatisch in ein Modell der Zelle zusammenführen und analysieren, ohne dass man diese im Vorfeld entsprechend aufbereiten muss. Dazu nutzen die Forscher Methoden des maschinellen Lernens, eines Bereiches der künstlichen Intelligenz. Die Entwicklung der Datenaufbereitung und -analyse wird nun von der Chan Zuckerberg Initiative (CZI) gefördert. Mit der CZI finanzieren der Facebook-Gründer Marc Zuckerberg und Priscilla Chan seit 2015 Projekte in Wissenschaft und Forschung, Bildung sowie in sozialer Gerechtigkeit und Inklusion. Das Zusammenführen der unterschiedlichen Daten soll detailreiche molekulare Profile von einzelnen Zellen und Zelltypen ermöglichen und so konkrete Fragen beantworten, zum Beispiel: Welche Merkmale charakterisieren einen bestimmten Zelltyp? Ist die Zelle gesund oder krank? Wie kann ich aus den abgelesenen Genen, also der Genexpression, auf die Menge von bestimmten Oberflächenproteinen schließen? Welche regulatorischen DNA-Abschnitte spielen bei Erbkrankheiten eine Rolle? Wenn es um die Charakterisierung der Zelltypen geht, hat die Gruppe schon einige Antworten parat. So gelang es etwa Pia Rautenstrauch aus der AG Ohler, drei verschiedene Datentypen zur Genregulation derartig miteinander zu kombinieren, dass sie die biologisch relevanten Daten der jeweiligen Zellen herausfiltern konnte. Das Rauschen – also Unterschiede, die zum Beispiel allein auf der Messtechnik beruhten und die Interpretation der Daten erschweren – vernachlässigte ihr Deep-Learning-Modell dagegen. Mit dem Modell war Rautenstrauch im Winter 2021 auf dem NeurIPS-Wettbewerb erfolgreich. In einem anderen Projekt kategorisierten die Wissenschaftler um Ohler mit selbstlernenden Algorithmen die Datensätze von Genschaltern im Zebrafisch. Sie wollten herausfinden, welche Schalter es bei welchem Zelltyp gibt. Ökosystem für die Datenanalyse „Die CZI hat großes Interesse an solchen Methoden zur automatisierten Datenintegration. Sie fördert ja ein umfangreiches Netzwerk biomedizinischer Labore“, sagt Ohler. Programme wie die von Ohlers Arbeitsgruppe sollen die vielschichtigen Daten der Forschungsgruppen zusammenführen und deren gemeinsame Analyse ermöglichen. Das Ziel sei letztlich „ein großes Ökosystem für Analyseplattformen, das dann allen Interessierten zur Verfügung gestellt wird“, sagt Ohler. Schließlich könnten die entwickelten Methoden und Prinzipien auf ganz andere Forschungsfelder übertragen werden, sagt Ohler. Denkbar sei zum Beispiel die Integration von unterschiedlichen Satellitenmessdaten, die verschiedene Wellenlängen abdecken. Auch in solchen Fällen müsse man die Informationen sinnvoll zusammenführen, um ein aussagekräftiges Gesamtbild zu erhalten.
Mehr erfahren zu: "Genetischer Risikofaktor und Virusinfektion tragen gemeinsam zur Multiplen Sklerose bei" Genetischer Risikofaktor und Virusinfektion tragen gemeinsam zur Multiplen Sklerose bei Multiple Sklerose wird durch eine Infektion mit dem Epstein-Barr-Virus mitverursacht. Daneben spielen aber auch bestimmte Genvarianten eine wichtige Rolle. Wie Forschende der Universität Zürich zeigen, führt erst das molekulare Zusammenspiel […]
Mehr erfahren zu: "2000 Jahre alte Herpesviren im menschlichen Genom" 2000 Jahre alte Herpesviren im menschlichen Genom Eine neue Studie bestätigt, dass bestimmte humane Herpesviren bereits vor tausenden Jahren Teil des menschlichen Genoms wurden. Die aktuellen Genomdaten liefern den ersten direkten Beweis für die Entwicklung der Viren […]
Mehr erfahren zu: "Darmpolypen: DNA-Tests verbessern den Einblick in erbliche Risiken" Darmpolypen: DNA-Tests verbessern den Einblick in erbliche Risiken Bei fünf bis zehn Prozent der Darmkrebspatienten spielen erbliche Faktoren eine Rolle. Dabei ist der Anteil bei jüngeren Personen höher. Die DNA-Analyse von Darmpolypen liefert wichtige zusätzliche Informationen über die […]