Generative Artificial Intelligence: Verbesserung diagnostischer Systeme durch künstlich erzeugte Bilddaten

Symbolbild: © Martin Rettenberger/stock.adobe.com

Durch generative Künstliche Intelligenz (KI) können große, anonymisierte Bilddatensätze zur Entwicklung diagnostischer Systeme erstellt werden. Der Vorteil liegt laut Autoren einer neuen Studie auch im Schutz von Patientendaten.

Forschende der Medizinischen Universität (MedUni) Wien (Österreich) haben in einer internationalen Kollaboration eine generative KI entwickelt, mit der medizinische Bilddaten künstlich erzeugt und verarbeitet werden können. Die so entstandenen Daten wurden anschließend zur Entwicklung diagnostischer KI-Systeme für mehrere Erkrankungen verwendet. Dabei konnte das Forschungsteam zeigen, dass die Genauigkeit der KI-Modelle durch den Einsatz künstlicher Bilddaten erheblich verbessert wurde. Die Ergebnisse der Studie wurden kürzlich im Fachjournal „European Journal of Nuclear Medicine and Molecular Imaging“ veröffentlicht.

Entscheidend: Qualität und Menge von Trainingsdaten

Der Einsatz von KI-Systemen in der medizinischen Bildgebung gewinnt zunehmend an Bedeutung. Die Genauigkeit dieser Systeme hängt maßgeblich von der Qualität und Menge der Trainingsdaten ab. Allerdings sind klinische Datensätze oft in ihrer Verwendbarkeit begrenzt – sei es durch geringe Mengen an Daten zu seltenen Erkrankungen, strikten Datenschutzbestimmungen oder der Unterrepräsentation einzelner Subgruppen. Im schlimmsten Fall kann dies zu ungenauen Vorhersagen der KI-Modelle führen, insbesondere wenn die Trainingsdaten nicht repräsentativ für die gesamte Bevölkerung sind.

Die Erzeugung künstlicher Datensätze mittels generativer KI bietet eine vielversprechende Lösung für diese Herausforderungen. Durch gezielt synthetisierte medizinische Bilddaten können KI-Systeme auf eine breitere Vielfalt an Krankheitsbildern trainiert werden, ohne auf seltene oder schwer zugängliche Patientendaten angewiesen zu sein. Diesen Ansatz verfolgte ein Forschungsteam der Klinischen Abteilung für Nuklearmedizin (Universitätsklinik für Radiologie und Nuklearmedizin) der MedUni Wien in einer kürzlich veröffentlichten Studie. Dabei wurde eine generative KI auf mehr als 9000 Scans von klinischen Routineuntersuchungen der Szintigraphie-Ambulanz trainiert. Anschließend wurde das Modell dazu verwendet, einen synthetischen Bilddatensatz zu erzeugen, der die charakteristischen Merkmale realer medizinischer Bilddaten abbildet, diese jedoch vollständig neu generiert und somit keine patientenbezogenen Informationen zurückverfolgen lässt.

Künstliche Bilddaten mit gleicher Qualität

Die Qualität der synthetischen Daten wurde von vier unabhängigen Ärzten geprüft. Dabei stellte sich heraus, dass zwischen den künstlich erzeugten und realen Bilddaten kein Unterschied erkennbar war. Im Rahmen der Studie wurde die Relevanz der synthetischen Daten durch eine unabhängige Forschungsgruppe der Universität Brescia (Italien) bestätigt. Ein Team aus Forschenden entwickelte dort ein KI-System zur Detektion von Patienten mit Verdacht auf kardiale Amyloidose oder Knochenmetastasen, das mit den in Wien generierten künstlichen Bilddaten trainiert wurde. Anschließend wurde das Systems anhand von Daten von mehr als 6000 Patienten aus vier unabhängigen Institutionen in Europa und Asien validiert. Die Ergebnisse zeigten, dass durch die Integration künstlicher Daten die diagnostische Genauigkeit des AI-Systems erheblich verbessert wurde.

Ein wesentlicher Vorteil dieser Technologie liegt laut David Haberl und Clemens Spielvogel vom Studienteam der MedUni Wien im Schutz der Patientendaten: Da die generierten Bilder keine realen Patienten abbilden, können sie ohne Datenschutzrisiken für die Forschung und Entwicklung neuer KI-gestützter Diagnoseverfahren genutzt werden. Darüber hinaus ermöglicht die Hinzugabe synthetisch generierter Daten die gezielte Erweiterung von Datensätzen. So kann beispielsweise durch die gezielte Hinzunahme von Daten unterrepräsentierter Subgruppen ein Datensatz angepasst werden. Dadurch lässt sich die Genauigkeit der resultierenden KI-Systeme für diese Subgruppen in der klinischen Anwendung deutlich verbessern.