KI-Modelle für Medikamentenentwicklung versagen bei der Physik

Dreidimensionale Darstellung eines Interferon-beta-Proteins, basierend auf dem Eintrag in einer Protein-Datenbank. (Bild: © molekuul.be – Adobe Stock)

KI-Programme können die Entwicklung von Medikamenten unterstützen, indem sie die Wechselwirkung von Proteinen mit kleinen Molekülen vorhersagen. Aktuelle Forschungsergebnisse zeigen jedoch, dass diese Programme nur Muster auswendig lernen, statt physikalische Zusammenhänge zu verstehen. 

Proteine spielen nicht nur im Körper eine zentrale Rolle, sondern auch in der Medizin: Sie dienen entweder als Wirkstoff, etwa als Enzym oder Antikörper, oder sie sind Zielstruktur für Medikamente. Der erste Schritt für neue Therapien ist deshalb meistens, die dreidimensionale Struktur von Proteinen zu entschlüsseln.

Bis Maschinelles Lernen Einzug in die Proteinforschung hielt, war die Aufklärung von Proteinstrukturen sehr aufwendig. Mit der Entwicklung von KI-Modellen wie AlphaFold oder RosettaFold begann ein neues Zeitalter: Sie errechnen, wie sich die Kette der Aminosäuren zu einer dreidimensionalen Struktur zusammenfaltet. 2024 erhielten die Entwickler dieser Programme den Nobelpreis für Chemie.

Verdächtig hohe Erfolgsquote

Die neuesten Versionen dieser Programme gehen sogar noch einen Schritt weiter: Sie berechnen, wie das fragliche Protein mit einem anderen Molekül interagiert. „Diese Möglichkeit, die Struktur von Proteinen zusammen mit einem Liganden vorauszusagen, ist von unschätzbarem Wert für die Medikamentenentwicklung“, erklärt Prof. Markus Lill von der Universität Basel. Mit seinem Team am Departement Pharmazeutische Wissenschaften erforscht er Methoden für das Design von Wirkstoffen.

Allerdings machten die angeblich hohen Erfolgsquoten bei der Strukturvorhersage Lill und seine Mitarbeitenden stutzig. Zumal es für das Training der KI-Modelle nur etwa 100.000 bereits aufgeklärte Strukturen von Proteinen zusammen mit ihren Liganden gibt – relativ wenig im Vergleich zu anderen Trainingsdatensätzen für KI. „Wir wollten herausfinden, ob diese KI-Modelle anhand der Trainingsdaten wirklich die physikalisch-chemischen Grundlagen lernen und richtig anwenden“, erklärt Lill.

Gleiche Vorhersage bei zerstörter Bindungsstelle

Dazu veränderten die Forschenden die Aminosäuresequenz hunderter Beispielproteine so, dass die Bindungsstelle für ihren Liganden eine völlig andere Ladungsverteilung aufwiesen oder sogar gänzlich blockiert waren. Dennoch sagten die KI-Modelle die gleiche Struktur voraus – so als sei die Bindung nach wie vor möglich. Ähnlich verfuhren die Forschenden mit den Liganden: Sie veränderten diese so, dass sie eigentlich nicht mehr an das fragliche Protein andocken können. Die KI-Modelle störten sich auch hier nicht daran.

In mehr als der Hälfte der Fälle sagten die Modelle die Struktur deshalb so voraus, als hätte es die störenden Eingriffe in die Aminosäureabfolge nie gegeben. „Das zeigt uns, dass selbst die modernsten KI-Modelle nicht wirklich verstehen, warum ein Medikament an ein Protein bindet. Sie erkennen nur Muster, die sie schon einmal gesehen haben“, fasst Lill zusammen.

Unbekannte Proteine besonders schwierig

Besondere Schwierigkeiten machte es den KI-Modellen, wenn die Proteine keine Ähnlichkeit zu den Trainingsdatensätzen aufwiesen. „Wenn sie etwas völlig Neues sehen, liegen sie schnell daneben. Genau dort liegt aber der Schlüssel zu neuen Medikamenten“, betont Lill.

Für die Medikamentenentwicklung sind die KI-Modelle dem Forscher zufolge daher mit Vorsicht zu betrachten. Es gelte, die Vorhersagen der Modelle mithilfe von Experimenten oder computergestützter Analysen zu validieren, die tatsächlich die physikalisch-chemischen Eigenschaften berücksichtigen. Auf diese Weise prüften auch die Forschenden im Zuge ihrer Studie die Ergebnisse der KI-Modelle.

„Die bessere Lösung wäre, die physikalisch-chemischen Gesetzmäßigkeiten in künftige KI-Modelle zu integrieren“, erklärt Lill. Diese könnten dann mit ihren realistischeren Strukturvorhersagen eine bessere Grundlage für die Entwicklung neuer Medikamente bieten, insbesondere bei Proteinstrukturen, die bisher schwierig aufzuklären waren und die Möglichkeit für völlig neue Therapieansätze eröffnen würden.