Vorhersage von Genmutationen bei Lungenkrebs: Deep Learning mit histologischen Bildern ergibt leistungsfähiges DeepGEM-Modell

Bild: ©Dee karen – stock.adobe.com

Chinesische Wissenschaftler haben eine auf Künstlicher Intelligenz basierende Methode entwickelt, die bei Lungenkrebs eine genaue, zeitnahe und kostengünstige Vorhersage von Gen­mutationen und deren räumlicher Verteilung erlaubt.

Die annotationsfreie, Deep-Learning-gestützte KI-Methode ermögliche die Vorhersage von Genmutationen (DeepGEM) aus routinemäßig gewonnenen histologischen Schnitten, schildert das Team um Dr. Yu Zhao vom First Affiliated Hospital of Guangzhou Medical University, China.

In der retro­spektiven Studie erhoben die Wissenschaftler Daten von Patienten mit Lungenkrebs, bei denen an 16 Krankenhäusern in China eine Biopsie genommen und eine Multigen-Next-Generation-Sequenzierung durch­geführt wurde (ohne Einschränkungen hinsichtlich Alter, Geschlecht oder Histologie-Typ). Dabei bestand das Ziel der Autoren darin, einen großen multizentrischen Datensatz mit paarweise zugeordneten pathologischen Bildern und Informationen zu mehreren Genmutationen zu erstellen.

Darüber hinaus schlossen sie Patienten aus dem öffentlich verfügbaren Datensatz des Cancer Genome Atlas (TCGA) ein. Das neue Modell basiert auf einer co-überwachten mehrstufigen Lernmethode auf ­Instanz- und Bag-Ebene mit einem „Label Disambiguation Design“. Die Wissenschaftler trainierten und testeten das DeepGEM-Modell zunächst am internen Datensatz und evaluierten es anschließend am externen Datensatz (Patienten der anderen 15 Zentren) und dem öffentlichen TCGA-Datensatz.

Zusätzlich wurde ein Datensatz von Patienten aus ­derselben Klinik wie der interne Datensatz (ohne Überlappung) ­verwendet, um die Generalisierungsfähigkeit des Modells für ­Biopsie-Proben von Lymphknotenmetastasen zu evaluieren.

Als primären Endpunkt hatte das Team die Leistung des DeepGEM-Modells bei der Vorhersage von Genmutationen (Fläche unter der Kurve [AUC] und Genauigkeit) in den 4 vorab festgelegten Gruppen (internes Hold-out-Testset, multizentrisches externes Testset, TCGA-Set und Lymphknotenmetastasen-Set) definiert.

Pathologische Bilder von mehr als 3600 Patienten

Für 3697 Patienten mit Biopsie und Multigen-Next-Generation-Sequenzierung (01.01.2018–31.03.2022) in den 16 Zentren lagen auswertbare pathologische Bilder und Informationen zu Multigentests vor. Ausgeschlossen wurden 60 Patienten aufgrund qualitativ minderwertiger Bilder. Das Team konnte 3767 Bilder von 3637 konsekutiven Patienten in die Auswertung einschließen (1978 Männer [54,4  %], 1514 Frauen [41,6 %], 145 mit unbekanntem Geschlecht [4,0 %]; medianes Alter 60 Jahre [IQR 52–67]). Dabei entfielen 1716 Patienten auf den internen Datensatz, 1718 auf den externen und 203 auf den Datensatz zu Lymphknotenmetastasen.

Robuste Leistung im internen Datensatz

Wie Zhao et al. berichten, zeigte das DeepGEM-Modell im internen Datensatz eine robuste Leistung: Bei Exzisionsbiopsie-Proben lagen die AUC-Werte für die Vorhersage von Genmutationen zwischen 0,90 (95 %-KI 0,77–1,00) und 0,97 (95 %-KI 0,93–1,00) und die Genauigkeitswerte zwischen 0,91 (95 %-KI 0,85–0,98) und 0,97 (95 %-KI 0,93–1,00). Für Aspirationsbiopsie-Proben lagen die AUC-Werte zwischen 0,85 (95 %-KI 0,80–0,91) und 0,95 (95 %-KI 0,86–1,00) und die Genauigkeitswerte zwischen 0,79 (95 %-KI 0,74–0,85) und 0,99 (95 %-KI 0,98–1,00).

Im multizentrischen externen Datensatz kamen die Autoren für Exzisionsbiopsie-Proben auf AUC-Werte zwischen 0,80 (95 %-KI 0,75–0,85) und 0,91 (95 %-KI 0,88–1,00) und auf Genauigkeitswerte zwischen 0,79 (95 %-KI 0,76–0,82) und 0,95 (95 %-KI 0,93–0,96); Für Aspira­tionsbiopsie-Proben lagen die AUC-Werte zwischen 0,76 (95 %-KI 0,70–0,83) und 0,87 (95 %-KI 0,80–0,94) und die Genauigkeitswerte zwischen 0,76 (95 %-KI 0,74–0,79) und 0,97 (95 %-KI 0,96–0,98).

Darüber hinaus zeigte das Modell auch beim TCGA-Datensatz eine starke Leistung (473 Patienten; 535 Objektträger; AUC-Werte zwischen 0,82 [95 %-KI 0,71–0,93] und 0,96 [95 %-KI 0,91–1,00], Genauigkeitswerte zwischen 0,79 [95 %-KI 0,70–0,88] und 0,95 [95 %-KI 0,90–1,00]). Ein weiterer Befund war, dass das DeepGEM-Modell, das an Biopsieproben aus der Primärregion trainiert wurde, auf Biopsie-Proben von Lymphknotenmetastasen generalisiert werden konnte. Es ergab AUC-Werte von 0,91 (95 %-KI 0,88–0,94) für EGFR und 0,88 (95 %-KI 0,82–0,93) für KRAS sowie Genauigkeitswerte von 0,85 (95 %-KI 0,80–0,88) für EGFR und 0,95 (95 %-KI 0,92–0,96) für KRAS und zeigte Potenzial für die Prognose zielgerichteter Therapien. Das Modell habe Karten generiert, welche die räumliche Verteilung von Genmutationen darstellen, heißt es abschließend. (sf)

Autoren: Zhao Y et al.
Korrespondenz: Prof. Wenhua Liang; [email protected]
Studie: Deep learning using histological images for gene mutation prediction in lung cancer: a multicentre retrospective study
Quelle: Lancet Oncol 2025;26(1):136–146.
Web: doi.org/10.1016/S1470-2045(24)00599-0