Künstliche Intelligenz sagt Risiko von mehr als 1000 Erkrankungen vorher

Symbolfoto: ©khunkornStudio/stock.adobe.com

Während ChatGPT darauf trainiert wurde, Textbausteine vorherzusagen, kann ein neues GPT-Modell offenbar das Risiko für eine Vielzahl von Krankheiten Jahre im Voraus abschätzen. Kommt jetzt „HealthGPT“?

Ein neu entwickeltes Modell basierend auf Künstlicher Intelligenz (KI) soll das Risiko für eine große Zahl von Erkrankungen prognostizieren können. Laut Experten handelt es sich allerdings noch um Zukunftsmusik – und es bestehen ethische Bedenken.

Mithilfe des KI-Modells namens Delphi-2M soll vorhergesagt werden können, wie hoch das Risiko für mehr als 1000 Erkrankungen bei einzelnen Personen sowie in Populationen ist. Delphi-2M soll außerdem Prognosen über den Gesundheitszustand für einen Zeitraum von bis zu 20 Jahren geben. Die Studie zur Entwicklung dieses Modells – angeleitet von Forschenden des Europäischen Laboratoriums für Molekularbiologie (EBML), des Deutschen Krebsforschungszentrums (DKFZ) und der Universität Kopenhagen (Dänemark) – wurde jüngst im Fachjournal „Nature“ publiziert.

Modellausweitung von einzelnen zu vielen Erkrankungen

In etlichen Publikationen wurde bereits dargestellt, wie KI im medizinischen Alltag zum Einsatz kommen kann. Ob zur Unterstützung bei der Diagnostik oder beim Schreiben von Arztbriefen – einige Fachleute sprechen ihr ein hohes Potenzial zu. Was die Vorhersage von Erkrankungsrisiken angeht, gab es bisher vor allem Modelle, die die Auftretenswahrscheinlichkeit für einzelne Krankheiten adressieren. An der gemeinsamen Kalkulation vieler verschiedener Erkrankungen scheiterten die Modelle bisher. Doch nun soll das KI-Modell Delphi-2M diese Forschungslücke schließen.

Im Rahmen der aktuellen Studie entwickelten die verantwortlichen Wissenschaftler anhand der Daten von 400.000 Personen aus der UK Biobank ein „Generative Pre-trained Transformer“-Modell (GPT-Modell). Dabei verwendeten sie sowohl klinische Diagnosen als auch andere relevante Informationen wie Body-Mass-Index, Geschlecht sowie Alkohol- und Nikotinkonsum, um das Modell auf die zeitlichen Verläufe des Gesundheitszustandes zu trainieren. Anschließend testeten sie das GPT-Modell an Daten von 1,9 Millionen Personen aus einem dänischen Krankheitsregister.

Die „Grammatik“ der Gesundheitsdaten

„So wie große Sprachmodelle aus der Abfolge von Wörtern in Texten die Grammatik unserer Sprache lernen können, lernt dieses KI-Modell die Logik der zeitlichen Abfolge von Ereignissen in Gesundheitsdaten, um ganze Krankengeschichten zu modellieren“, erklärt Moritz Gerstung vom DKFZ. Zu diesen Ereignissen gehören medizinische Diagnosen oder auch Lebensstilfaktoren wie Rauchen. An der Reihenfolge, in der die Ereignisse eintreten, und der Zeit, die zwischen diesen Ereignissen vergeht, lernt das Modell, das Krankheitsrisiko vorherzusagen.

„Medizinische Ereignisse folgen oft vorhersehbaren Mustern“, sagt Tom Fitzgerald vom Europäischen Bioinformatik-Institut des EMBL (EMBL-EBI). „Unser KI-Modell lernt diese Muster und kann zukünftige Gesundheitsergebnisse prognostizieren. Es gibt uns die Möglichkeit, auf der Grundlage der Krankengeschichte einer Person und anderer wichtiger Faktoren zu untersuchen, was passieren könnte. Entscheidend ist, dass es sich dabei nicht um eine Gewissheit handelt, sondern um eine Einschätzung der potenziellen Risiken.“

Gute Vorhersagekraft – mit Einschränkungen

Die in „Nature“ publizierten Ergebnisse zeigen, dass die Vorhersagekraft von Delphie-2M für den Gesundheitsverlauf ähnlich gut oder sogar besser ist als die von Modellen, die nur einzelne Erkrankungen vorhersagen. Je nach Erkrankung war die Vorhersagegenauigkeit allerdings sehr unterschiedlich. Relativ sichere Vorhersagen schafft das Modell bei Erkrankungen mit klaren und konsistenten Verlaufsmustern, wie bei bestimmten Krebsarten, Diabetes und Herzinfarkten, aber auch beim Tod. Bei Erkrankungen, die selten sind oder deren Verlauf nicht klar und gradlinig ist – wie beispielsweise psychische Störungen, Schwangerschaftskomplikationen und Infektionskrankheiten –, ist die Vorhersage schlechter.

Zudem merken die Autoren selbst an, dass in der UK Biobank bestimmte Personengruppen, wie britische und ältere Menschen, über- und andere wiederum unterrepräsentiert sind. Entsprechend sind die Vorhersagen des Modells für diese Personen genauer als für andere. Daher schränken die Autoren ein, ihr KI-Modell sei noch nicht bereit für den Einsatz in der Klinik. Stattdessen sollte es weiter erforscht und beispielsweise mit zusätzlichen Daten, wie Blutwerten, ergänzt und optimiert werden.

Risiken für den Einzelnen …

„Bias und auch mögliche Diskriminierungen bleiben eine zentrale Herausforderung für jedes KI-Modell in der Medizin“, gibt auch Robert Ranisch, Juniorprofessor für Medizinische Ethik mit Schwerpunkt auf Digitalisierung an der Universität Potsdam, zu bedenken. „Ein Modell, das gleich Hunderte Krankheiten vorhersagt, bündelt Chancen, verstärkt aber auch das Risiko von Verzerrungen“, meint der Experte, der selbst nicht an der Studie beteiligt war.

Seiner Ansicht nach handelt es sich bei dem Modell noch um Zukunftsmusik. „Der Weg in die konkrete medizinische Anwendung ist meist länger, als man denkt“, betont Ranisch. Mit Blick auf das Wohl der Patienten wendet er ein, dass solche Prognosen keine Schicksalsurteile seien. Jedoch könnten sie Anhaltspunkte für Präventions- oder Therapieentscheidungen geben.

„Wichtig ist dabei, dass der Einsatz solcher Modelle den Entscheidungsspielraum der Patienten nicht einengt. Ihre Autonomie im Jetzt darf nicht einem Behandlungsregime untergeordnet werden, das allein auf zukünftige Gesundheit ausgerichtet ist. Selbst wo dies nicht geschieht, bliebe doch eine gewisse Nötigung, sich zu prognostizierten Zukünften zu verhalten. Entscheidend bleibt deshalb auch ein Recht auf Nichtwissen“, hebt der Medizinethiker hervor.

Das Recht auf Nichtwissen ist auch für PD Dr. Markus Herrmann, Leiter des Bereichs KI-Ethik am Institut für Medizin- und Datenethik der Universität Heidelberg, zentral. Der Mensch habe ein Recht darauf, sein Leben nicht in Sorge oder gar Angst vor drohender Krankheit zu führen. Wollen Patienten jedoch mit den Ergebnissen der Berechnung ihres persönlichen Gesundheitsrisikos konfrontiert werden, sei die ärztliche Risikokommunikation entscheidend, um dem Patienten die Aussagekraft darzulegen und die Ergebnisse in den richtigen Kontext zu setzen.

Ranisch fürchtet ferner, dass KI-Modelle dieser Art falsche Begehrlichkeiten wecken könnten, beispielsweise bei Versicherungen oder Arbeitgebern. „Dann geht es weniger darum, ob die Vorhersagen tatsächlich belastbar sind, sondern um die Illusion einer exakten Berechenbarkeit. Diese kann dazu führen, dass Menschen ungerechtfertigt benachteiligt werden. Deshalb müssen wir sehr genau überlegen, wo wir solche Modelle im Gesundheitssystem einsetzen wollen.“

… aber Chancen auf Populationsebene

Neben dem Risiko des Einzelnen hat Dr. Carsten Marr, Direktor des Institute of AI for Health am Helmholtz Zentrum München, auch das große Bild im Blick. „Wo gibt es Korrelationen zwischen Krankheiten, die wir vorher nicht gesehen haben? Wo gibt es Auffälligkeiten zwischen bestimmten Events, die später zu einer Krankheit führen?“ In diesen Fragen sieht er das eigentliche Potenzial des neuen GPT-Modells. Zudem biete das Modell eine gute Grundlage, um Zusammenhänge von Faktoren, die in Einzelstudien herauskamen, zu überprüfen.

Prof. Julian Varghese, Direktor des Instituts für Medical Data Science an der Otto-von-Guericke-Universität Magdeburg, resümiert: „Das Modell stellt […] einen robusten Ansatz dar, um auf Populationsebene Krankheitslasten vorherzusagen, Szenarien unter Variation verschiedener Risikofaktoren zu simulieren und Versorgungsplanung oder Präventionsstrategien datenbasiert zu unterstützen.“

(ah/BIERMANN)