Erste Leitlinie zur Anwendung von KI in der klinischen Praxis

Modelle mit Künstlicher Intelligenz (KI) werden in der Onkolgie immer häufiger angewendet. Symbolbild: Martin Rettenberger/stock.adobe.com

Die European Society for Medical Oncology (ESMO) hat zeitgleich mit dem ESMO Kongress 2025 ihre erste strukturierte Leitlinie zum sicheren Umgang mit KI-Sprachmodellen in der Onkologie veröffentlicht.

Der Leitfaden zur Verwendung von Large Language Models in der klinischen Praxis (ELCAP) wurde gestern in der ESMO-Fachzeitschrift „Annals of Oncology“ veröffentlicht. Passend dazu finden auf dem ESMO Kongress 2025 (17. bis 21. Oktober in Berlin) in diesem Jahr erstmals mehrere Veranstaltung zum Einsatz von Künstlicher Intelligenz (KI) in der onkologischen Forschung und Praxis statt. Unter anderem gibt es Sitzungen zum Thema „KI in klinischen Studien“ und „Chat-GPT in der Krebsbehandlung“.

„Die Priorität der ESMO besteht darin, sicherzustellen, dass Innovationen zu messbarem Nutzen für Patienten und praktikablen Lösungen für Kliniker führen. Mit ELCAP bietet die ESMO einen pragmatischen, Onkologie spezifischen Rahmen, der KI einbezieht und gleichzeitig klinische Verantwortung, Transparenz und robusten Datenschutz gewährleistet“, erklärt Prof. Fabrice André, Präsident der ESMO.

ELCAP differenziert auf drei Ebenen

Die Verwendung von Large Language Models (LLMs) nimmt in der Onkologie stetig zu, dennoch beachtet die ELCAP, dass die Chancen und Risiken je nach Benutzer – ob Patienten, Kliniker oder Institutionen – variieren. In ELCAP sind daher die Empfehlungen in einer dreiteiligen Struktur verankert und übergeordnete Prinzipien in 23 Konsenserklärungen für die tägliche Praxis zusammengefasst:

  • Die erste Kategorie (Typ 1) umfasst patientenorientierte Anwendungen wie Chatbots zur Aufklärung und Symptomklärung. Diese sollen die klinische Versorgung ergänzen und innerhalb überwachter Behandlungsrahmen mit expliziter Eskalation und robustem Datenschutz eingesetzt werden.
  • Die zweite Kategorie (Typ 2) umfasst Tools für medizinisches Fachpersonal wie Entscheidungsunterstützung, Dokumentation und Übersetzung, die eine formale Validierung, transparente Einschränkungen und explizite menschliche Verantwortung für klinische Entscheidungen erfordern.
  • Die dritte Kategorie (Typ 3) betrifft institutionelle Hintergrundsysteme, die in elektronische Patientenakten integriert sind und Aufgaben wie Datenextraktion, automatisierte Zusammenfassungen und den Abgleich klinischer Studien übernehmen. Diese Systeme erfordern Tests vor der Bereitstellung, eine kontinuierliche Überwachung auf Verzerrungen und Leistungsänderungen, institutionelle Governance und eine erneute Validierung bei Änderungen von Prozessen oder Datenquellen. Kliniker sollten sich auch darüber im Klaren sein, wann solche Systeme in ihrem Umfeld eingesetzt werden, da ihre Auswirkungen von Interoperabilität und Maßnahmen zum Schutz des Datenschutzes abhängen.

Spezifische Erwartungen für besseren Nutzen

Die Zuverlässigkeit der Ergebnisse hängt in allen Bereichen von der Vollständigkeit und Richtigkeit der Eingabedaten ab: Lücken in der klinischen Dokumentation oder unvollständige Patientenanfragen können zu ungenauen oder irreführenden Antworten führen, was die Notwendigkeit von Überwachung und klaren Eskalationswegen unterstreicht.

„ELCAP erkennt an, dass der Wert von Sprachmodellen davon abhängt, wer sie nutzt“, sagt Prof. Miriam Koopman, Vorsitzende der ESMO Real World Data & Digital Health Task Force und Co-Autorin der Veröffentlichung. „Indem wir zwischen patientenorientierten, klinikorientierten und institutionellen Hintergrundsystemen unterscheiden, setzen wir Erwartungen für jeden Kontext: überwachte Behandlungspfade für Patienten, validierte und transparente Tools für Kliniker sowie kontinuierlich überwachte, gut verwaltete Systeme, die in die elektronischen Patientenakten eingebettet sind.“

Verantwortung bleibt in menschlicher Hand

ELCAP konzentriert sich dabei auf assistierende LLMs, die unter menschlicher Aufsicht arbeiten und Kliniker durch die Bereitstellung von Informationen oder die Erstellung von Inhalten unterstützen, anstatt eigenständig zu handeln.

„Diese Systeme sollen klinische Arbeitsabläufe und Entscheidungsprozesse verbessern – und nicht ersetzen“, stellt Prof. Jakob N. Kather, stellvertretender Vorsitzender der ESMO Real World Data & Digital Health Task Force und ebenfalls Co-Autor der Studie, klar. „Gleichzeitig trägt die Leitlinie der rasanten Entwicklung autonomer oder ‚agentischer‘ KI-Modelle Rechnung, die ohne direkte Aufforderung Aktionen einleiten können. Dies wirft erhebliche sicherheitstechnische, regulatorische und ethische Herausforderungen auf und erfordert künftig gezielte Leitlinien.“

Mit Blick in die Zukunft betont der ESMO-Präsident: „Ein verantwortungsvoller Einsatz von KI in der Onkologie erfordert gemeinsame Standards ebenso wie Algorithmen. ELCAP zeigt auf, wie Sprachmodelle so eingesetzt werden können, dass sie die Qualität, Gerechtigkeit und Effizienz der Krebsbehandlung verbessern, ohne das Vertrauen in die klinische Beurteilung zu beeinträchtigen.“

Zur Entwicklung

ELCAP wurde zwischen November 2024 und Februar 2025 von einem 20-köpfigen internationalen Gremium aus den Bereichen Onkologie, KI, Biostatistik, digitale Gesundheit, Ethik und Patientenperspektive entwickelt, das im Rahmen der ESMO Real World Data & Digital Health Task Force einberufen wurde.

(mkl/BIERMANN)