KI kann psychiatrische Diagnosestellung verbessern

Künstliche Intelligenz kann helfen, die Diagnostik psychischer Erkrankungen effizienter und präziser zu gestalten. (Bild: © Animation_vector/stock.adobe.com)

Ein Kölner Forschungsteam testete, wie drei große Sprachmodelle Überschneidungen und Redundanzen in klinischen Fragebögen zu psychischen Erkrankungen feststellen. So kann die Diagnosestellung verbessert werden.

Die Analyse zeigt: Große Sprachmodelle können Fragebögen zur Diagnosestellung psychischer Erkrankungen optimieren, indem sie symptomatische Redundanzen reduzieren und die Verallgemeinerbarkeit von Symptomen verbessern. Sie könnten sogar zu neuen Konzeptualisierungen psychischer Störungen beitragen. Das Ergebnis stammt aus einer internationalen Studie unter Leitung von Prof. Joseph Kambeitz und Prof. Kai Vogeley von der Universität zu Köln und der Uniklinik Köln. Die Studie ist in der Fachzeitschrift „Nature Mental Health“ erschienen.

Zur Diagnostik pschischer Erkrankungen verlassen sich Mediziner unter anderem auf Patientenberichte, die in Fragebögen erfasst werden. Hier ist oft die genaue sprachliche Formulierung einzelner Fragen entscheidend, um die richtige Diagnose zu stellen. Allerdings sind etablierte Fragebögen oft variabel. Die Forschenden fanden Hinweise, dass es bei der Feststellung von Depression, bipolarer Störung und dem Risiko einer Psychose inhaltliche Überschneidungen in den Fragen gibt und auch Abweichungen, was eine genaue Diagnose erschwert.

Darüber hinaus verlassen sich Ärzte auf ihre klinische Erfahrung. Das bedeutet, dass sie einzelne Symptome mit einer bestimmten Erkrankung assoziieren, die ihrer individuellen Erfahrung entspricht. Da verschiedene Krankheiten jedoch gleiche oder ähnliche Symptome hervorbringen können, kann dies ebenfalls das Risiko der Falschdiagnose erhöhen. „Wir wissen erstaunlich wenig darüber, ob und wie Formulierungen in klinischen Fragebögen bestimmte Assoziationen bei Ärztinnen und Ärzten auslösen“, erklärt Kambeitz. Inkonsistente Ergebnisse könnten zudem aus Unterschieden zwischen Patienten derselben Diagnosegruppe oder – alternativ – aus Unterschieden zwischen Fragebögen resultieren.

Große Sprachmodelle als Analysewerkzeug

Ein Ansatz, die sprachvermittelten Krankheitsbeschreibungen zu untersuchen, bieten sogenannte große Sprachmodelle (Large Language Models, kurz LLMs). Das Team nutzte die LLMs GPT-3, Llama und BERT, um die Struktur und den Inhalt von vier klinischen Fragebögen zu untersuchen. Grundlage waren Daten aus über 50.000 Fragebögen zu Depression, Angst, Psychoserisiko und Autismus.

In der klinischen Praxis treten Symptome häufig parallel auf – wie etwa empirische Assoziationen von Antriebsmangel und Freudverlust. Die Analyse zeigte, dass die LLMs „wissen“, welche Symptome in der Praxis gleichzeitig auftreten. Ohne Zugang zu spezifischen empirischen Daten, zeigen sich die gleichen Symptomassoziationen in LLMs rein auf Basis der Fragebogenformulierungen.

Perspektiven für die Zukunft

So eröffnen LLMs neue Perspektiven: Sie können psychologische Fragebögen verbessern, redundante Items vermeiden und Diagnostik sowie das Verständnis psychischer Erkrankungen effizienter gestalten. Die Modelle könnten Fragebögen entwickeln, die präzise Symptome erfassen, aber nur so viele Fragen stellen wie nötig, und so Patienten und Behandelnde entlasten.

„KI kann nicht nur medizinisches Wissen abbilden, sondern auch die Strukturen psychischer Erkrankungen. Das ist ein wichtiger Schritt, um digitale Methoden und Neurowissenschaften enger zusammenzuführen und Diagnostik sowie Forschung in der Psychiatrie weiterzuentwickeln“, so Vogeley.

Kambeitz resümiert: „In der Psychiatrie nimmt das ‚gesprochene Wort‘ in Diagnose und Therapie einen großen Stellenwert ein. Aktuell untersuchen zahlreiche vielversprechende Projekte, wie wir LLMs in der Psychiatrie anwenden können – von der Diagnostik über das Verfassen und Ergänzen von Befunden bis hin zur Simulation von Therapiegesprächen. Auf diesem Gebiet sind noch viele spannende Forschungsergebnisse zu erwarten.“