Ermittlung von COVID-19-Patienten mittels Künstlicher Intelligenz: Signale in der Stimme können Identifizierung ermöglichen

Abbildung: © andreusK/stock.adobe.com

COVID-19-Infektionen lassen sich dank Künstlicher Intelligenz (KI) und mithilfe einer Handy-App an der Stimme von Erkrankten erkennen. Darüber berichteten die Autoren einer neuen Studie beim internationalen Kongress der European Respiratory Society (ERS) Anfang September. 

Das in der vorgestellten Untersuchung verwendete KI-Modell ist den Wissenschaftlern zufolge genauer als Lateral-Flow-/Antigen-Schnelltests und zudem kostengünstig, führt schnell zu Ergebnissen und ist zudem einfach in der Anwendung. Das bedeute, so erklären die Studienautoren, dass es in ärmeren Ländern eingesetzt werden können, in denen Tests mit Polymerase-Kettenreaktion (PCR) teuer und/oder schwer in die Breite zu bringen sind.

Wafaa Aljbawi, Forscherin am Institute of Data Science der Universität Maastricht (Niederlande) berichtete, dass das KI-Modell in 89 Prozent der Fälle exakte Ergebnisse lieferte, während die Genauigkeit von Lateral-Flow-Tests je nach Hersteller stark schwankte. Außerdem seien Lateral-Flow-Tests beim Nachweis einer COVID-Infektion bei Personen, die keine Symptome zeigten, erheblich ungenauer, erklärte Aljbawi. „Diese vielversprechenden Ergebnisse deuten darauf hin, dass einfache Sprachaufzeichnungen und fein abgestimmte KI-Algorithmen möglicherweise eine hohe Präzision bei der Ermittlung von Patienten besitzen, die eine COVID-19-Erkrankung haben“, sagte sie. „Solche Tests können kostenlos zur Verfügung gestellt werden und sind einfach zu interpretieren. Darüber hinaus ermöglichen sie eine virtuelle Remote-Testung und haben eine Bearbeitungszeit von weniger als einer Minute. Sie könnten zum Beispiel bei großen Menschenansammelungen, an deren Zugängen eingesetzt werden und eine rasche Überprüfung der Bevölkerung ermöglichen.“

Eine COVID-19-Infektion betrifft normalerweise die oberen Atemwege und die Stimmbänder, was zu Veränderungen in der Stimme einer Person führt. Aljbawi und die Studienleiter Dr. Sami Simons, Pneumologe am Medizinischen Zentrum der Universität Maastricht, und Dr. Visara Urovi, ebenfalls vom Institute of Data Science, verwendeten Daten aus der Crowdsourcing-App COVID-19 Sounds der University of Cambridge (Großbritannien). Diese enthält 893 Audiobeispiele von 4352 gesunden und erkrankten Personen, von denen 308 positiv auf COVID-19 getestet wurden. Die App wird auf dem Mobiltelefon des Nutzers installiert. Zu Untersuchende lieferten einige grundlegende Informationen zu Demografie, Krankengeschichte und Raucherstatus und wurden dann gebeten, Atemgeräusche aufzunehmen. Dazu gehören dreimaliges Husten, drei- bis fünfmaliges tiefes Atmen durch den Mund und dreimaliges Vorlesen eines kurzen Satzes.

Die Forscher verwendeten eine Mel-Spektrogramm-Analyse – ein Verfahren, mit dem sich verschiedene Stimmmerkmale wie Lautstärke, Leistung und Variation im Laufe der Zeit identifizieren lassen. „Auf diese Weise können wir die vielen Eigenschaften der Stimmen der Teilnehmer [in einzelne Bestandteile] zerlegen“, erklärte Aljbawi. „Um die Stimme von Patienten mit COVID-19 von der solcher Personen zu unterscheiden, die nicht daran erkrankt sind, haben wir verschiedene KI-Modelle entwickelt und dann bewertet, welches am besten zur Klassifizierung der COVID-19-Fälle geeignet ist.“

Die Wissenschaftler stellten fest, dass ein Modell namens Long-Short Term Memory (LSTM) die übrigen untersuchten Modelle übertraf. LSTM basiert auf neuronalen Netzwerken, die die Funktionsweise des menschlichen Gehirns nachahmen und die zugrunde liegenden Beziehungen in Daten erkennen. Es arbeitet mit Sequenzen und ist aufgrund seiner Fähigkeit zur Datenspeicherung für die Modellierung von Signalen geeignet, die im Laufe der Zeit gesammelt wurden (z.B. von der Stimme).

Die Gesamtgenauigkeit des LSTM-Modells betrug 89 Prozent, ebenso wie Sensitivität. Die Spezifität bezifferten die Forschenden mit 83 Prozent.

„Diese Ergebnisse zeigen eine signifikante Verbesserung der Genauigkeit von COVID-19-Diagnosen im Vergleich zu hochmodernen Verfahren wie dem Lateral-Flow-Test“, bilanzierte Aljbawi. „Der Lateral-Flow-Test besitzt eine Sensitivität von nur 56 Prozent, jedoch eine höhere Spezifitätsrate von 99,5 Prozent. Dies ist wichtig, weil es bedeutet, dass der Lateral-Flow-Test infizierte Personen häufiger als COVID-19-negativ einstuft als unser Test. Mit anderen Worten: Mit dem KI-LSTM-Modell könnten wir 11 von 100 Fällen übersehen, die die Infektion weiterverbreiten würden, während der Lateral-Flow-Test 44 von 100 Fällen nicht erkennen würde.“ Die Wissenschaftlerin fuhr fort: „Die hohe Spezifität des Lateral-Flow-Tests bedeutet, dass nur eine von 100 Personen fälschlicherweise mitgeteilt wird, dass sie COVID-19-positiv ist, obwohl sie tatsächlich nicht infiziert ist, während mit dem LSTM-Test 17 von 100 nichtinfizierten Personen fälschlicherweise als positiv diagnostizieren würden. Da dieser Test jedoch praktisch kostenlos ist, ist es möglich, Personen zu PCR-Tests einzuladen, wenn die LSTM-Tests zeigen, dass sie positiv sind.“

Die Wissenschaftler betonen, dass eine Validierung ihrer bisherigen Ergebnisse anhand großer Patientenzahlen noch aussteht. Seit Beginn des Projektes wurden nun 53.449 Audio-Samples von 36.116 Teilnehmern gesammelt und konnten zur Verbesserung und Validierung der Genauigkeit des Modells verwendet werden. Die Forschenden führen außerdem weitere Analysen durch, um zu verstehen, welche Parameter in der Stimme das KI-Modell beeinflussen.