Diagnostik melanozytärer Naevi: Pathologen liegen häufig daneben

Foto: Symbolbild © M.Dörr & M.Frommherz – fotolia.com

Zur Quantifizierung der Genauigkeit und Reproduzierbarkeit von Diagnosen melanozytärer Hautläsionen seitens der Pathologie unternahmen US-amerikanische Forscher eine Studie zur Treffsicherheit der gestellten Diagnosen.

In 10 US-Bundesstaaten wurden Hautbiopsien (n=240) in Sets von 36 oder 48 Proben den teilnehmenden, randomisierten Pathologen zugesandt, die dasselbe Probenset unabhängig voneinander bei 2 Gelegenheiten (Phase 1 und 2), die mindestens 8 Monate auseinander lagen, interpretieren sollten.

Die Bewertungen seitens der Pathologen wurden in 5 Klassifikationen zusammengefasst: I: Naevus oder leichte Atypie; II: moderate Atypie; III: schwere Atypie oder Melanom in situ; IV: frühes invasives Melanom des Stadiums T1a; V: invasives Melanom des Stadiums T1B oder höher. In Phase 1 komplettierten 187 Pathologen 8.976 Fallbewertungen, die pro Fall mit durchschnittlich 10 unterschiedlichen diagnostischen Termini belegt wurden. Die Pathologen, die dieselben Fälle in beiden Phasen interpretierten und diese einen Fall als Stufe I oder V während Phase 1 diagnostizierten, gaben für die Mehrzahl der Fälle dieselbe Diagnose in Phase 2 (Klasse I 76,7 %; Klasse V 82,6 %). Die Reproduzierbarkeit war bei Fällen, die als Klasse II (35,2 %), III (59,9 %) und IV (63,2 %) eingestuft wurden, niedriger. Die durchschnittlichen Konkordanzraten waren niedriger, unterlagen aber demselben Trend.

Die Genauigkeit der Diagnosen variierte je nach Klassifikation: I, 92 % (95 % Konfidenzintervall, 90 % – 94 %); II, 25 % (22 %-28 %); III, 40 % (37 %-44 %); IV, 43 % (39 %-46 %); V 72 % (69 %-75 %). Im Rahmen eines angenommenen Populationslevels wären 82,8 % (81 %-84,5 %) der Diagnosen verifiziert, wenn sie durch ein Gremium erfahrener Pathologen einem Review unterzogen worden wären, wobei sich 8 % (6,2 %-9,9 %) der Fälle durch den Primärpathologen als überinterpretiert und 9,2 % (8,8 %-9,6 %) als unterinterpretiert erwiesen hätten. Die Spannweite der Diagnosen war weder reproduzierbar noch akkurat. Es sollten Anstrengungen unternommen werden, um die klinische Praxis zu optimieren und ein einheitliches Klassifikationssystem zu entwickeln.