Krebsdiagnose mittels Lernalgorithmus: Treffsicherheit mit dermatologischer Expertise vergleichbar

© Marco2811 – stock.adobe.com

Die Erfassung von fazialem Hautkrebs mithilfe eines Lernalgorithmus stellt aufgrund der variierenden anatomischen Strukturen eine besondere Herausforderung dar, da die individuell verschiedenen Kurven und Schatten den Algorithmus irritieren und so zu falsch-positiven Ergebnissen führen können.

Dermatologen der Universitätsklinik Seoul haben nun einen Algorithmus evaluiert, mit dessen Hilfe verdächtige Areale automatisch lokalisiert und die Wahrscheinlichkeit des Auftretens von Malignomen prognostiziert werden können. Ein neuronales Netzwerk wurde auf Basis von 182.348 klinischen Fotografien erstellt und 924.538 mögliche Läsionen angelegt. Nach Kommentierung dieser möglichen Läsionen wurde das neuronale Netzwerk mit 1.106.886 Bildzuschnitten trainiert, um Tumore zu lokalisieren und zu diagnostizieren. Die Validierungs­datensätze (2844 Bilder von 673 Patienten; 185 Patienten mit malignen Tumoren, 305 mit benignen Tumoren und 183 ohne Tumore) kamen von 3 Kliniken und stammten aus dem Zeitraum zwischen Januar 2010 und September 2018.

Das Areal unter der Grenzwertoptimierungskurve, der F1-Score sowie der Youden-Index-Score fanden Anwendung, um die Leistung des Algorithmus zu bestimmen. Der Algorithmus analysierte median 4,2 Bilder pro Patient und meldete den Malignom-Score in Übereinstimmung zum höchsten Output an Malignomen. Das Areal unter der Grenzwertoptimierungskurve betrug 0,910. Die Sensitivität lag bei 76,8 %, die Spezifität bei 90,6 %. Mithilfe einer Testpartition (325 Bilder von 80 Patienten) wurde die Leistung des Algorithmus mit der von 13 zertifizierten Dermatologen, 34 Assistenzärzten aus der Dermatologie, 20 Ärzten aus nicht dermatologischen Fachbereichen und 52 Probanden ohne medizinischen Background vergleichen.

Bei Evaluierung der Leistung zur Krankheitserkennung (unter Anwendung des F1-Scores und des Youden-Index-Scores) zeigte der Algorithmus höhere F1-Werte (0,831 gegenüber 0,653) sowie höhere Youden-Index-Werte (0,675 gegenüber 0,417) als es bei den nicht dermatologischen Fachärzten der Fall war. Die Treffsicherheit des Algorithmus war mit der von Dermatologen vergleichbar (F1-Score 0,831 gegenüber 0,835; Youden-Index-Score 0,675 gegenüber 0,671). (am)