- Wissenschaftler erarbeiten mithilfe Künstlicher Intelligenz Systeme, die eine Corona-Infektion anhand der Stimme diagnostizieren sollen.
- Merkmale, um Corona zum Beispiel von einer Erkältung zu unterscheiden, sind Rauigkeit der Stimme und eine häufig veränderte Sprechgeschwindigkeit.
- Sprachanalysen per App könnten in Kombination mit einem Schnelltest eine sicherere Corona-Schnelldiagnose liefern, als ein Schnelltest allein.
Bestimmte Krankheiten können anhand bestimmter Merkmale der menschlichen Stimme erkannt werden. Daran forschen Björn Schuller und sein Team von der Universität Augsburg bereits seit einigen Jahren.
"Die ersten maschinellen Sprachanalysen über Sprecher und Spracherkennung hinaus haben im Wesentlichen Ende der 90er Jahre begonnen", erzählt Schuller, Inhaber des Lehrstuhls für Embedded Intelligence for Health Care and Wellbeing, im Gespräch mit unserer Redaktion.
Man betrachtete zunächst, wie sich Stress und verschiedene Emotionen in der Stimme automatisch erkennen lassen. "Das hat sich dann Stück für Stück ausgeweitet, auf die Persönlichkeit und unterschiedliche Gesundheitszustände. Akustische Analysen haben ein großes Potenzial."
An der Schnittstelle von Informatik und Medizin ist es Wissenschaftlern gelungen, mithilfe von Künstlicher Intelligenz Systeme zu entwickeln, die Krankheits-Diagnosen stellen. Sie können Symptome identifizieren und sogar im Therapieverlauf eine Hilfeleistung darstellen. Zu Autismus, Parkinson, Erkältung oder auch Depression werden bereits seit Jahren von der Universität Augsburg Studien durchgeführt, dementsprechend viele Daten liegen vor.
Bei Erkrankungen wie Depression und der Entwicklungsstörung Autismus wurden Probanden bereits mit Apps oder Software im Rahmen von Projekten ausgestattet. "Bei den Analysen zu Depression untersuchen wir beispielsweise nicht nur die Stimme, sondern auch das gesprochene Wort und hören zu, wenn man das möchte. So entstehen Tagebücher, die den Verlauf der Erkrankung etwa über eine Woche zeigen", erklärt der Experte. "Diese Daten können dann der behandelnden Ärztin vorgelegt werden und bei der Therapie helfen."
Sprachanalysen von Corona-Infizierten
Als im Frühjahr 2020 in Deutschland der Lockdown verkündet wurde, forderte Schuller Stimmaufnahmen aus Wuhan in China an und begann mit den ersten Untersuchungen. "Uns war schnell klar, dass sich eine Atemwegserkankung, wie die Corona-Infektion, auf die Stimme auswirken muss. Unser Ziel ist es, COVID-19 aus Husten und der Sprache von Erkrankten zu erkennen und die Ergebnisse unterscheiden zu können von Menschen, die nicht infiziert sind", sagt Schuller. Seitdem arbeitet er mit weiteren Wissenschaftlern daran, ausreichend Daten zu generieren und herauszufinden, was den Klang von COVID-19 ausmacht.
Schuller hält die Analysen mittels App in der Praxis für umsetzbar. Als Zusatzkontrolle hätte eine Spracherkennungs-App seiner Meinung nach einen großen Mehrwert und könnte leicht eingesetzt werden. Wer beispielsweise schwer einschätzen kann, ob er eine Grippe hat oder sich mit dem Coronavirus infiziert hat, könnte kurz ins Handy sprechen und hätte innerhalb kurzer Zeit eine Auswertung.
"Die Kombination von Schnelltest und Sprachanalyse macht die Diagnose von COVID-19 sicherer, denn der Schnelltest ist auch nur zum Teil zuverlässig", sagt der Forscher. Die Sprachanalyse könne also eine Ergänzung sein, um die Schnelldiagnose eindeutiger zu machen oder sie könne als Vorfilter dienen.
Jedoch: "Die Umsetzung der Wissenschaft in die Praxis, zum Beispiel die Übertragung der Analysen auf eine App, dauert oft Jahre. Man könnte die Prozesse beschleunigen, aber für eine zertifizierte und validierte App, die auf allen Geräten gleich läuft, benötigt man Budgets in Millionenhöhe."
So funktionieren die Analysen
Bei Auswertungen von Sprache gibt es grundsätzlich zwei Vorgehensweisen. Beim traditionellen Verfahren werden Expertenmerkmale gesammelt, welche die Wissenschaftler analysiert haben. Bezogen auf COVID-19 sind es zum Beispiel bestimmte allgemeine Auffälligkeiten in der Grundfrequenz und Sprechgeschwindigkeit. Diese werden vorgegeben und der Computer sucht sich dann aus, welche die richtigen Kennzeichen bezogen auf die Infektion sind und was er benötigt, um COVID-19 von Asthma, einer Erkältung oder einer Lungenentzündung unterscheiden zu können.
Moderner ist das "deep learning", das "Tiefe Lernen". "Hier kann der Computer komplett selbstständig erlernen, worauf er achten muss. Das funktioniert in der Regel besser, weil er selbst herausfindet, was die besten Merkmale für die jeweilige Analyse sind," sagt Schuller. Nachteil: Wissenschaftlern fällt es bei dieser Methode schwer, herauszufiltern, worauf der Computer konkret achtet und was den Klang einer bestimmten Erkrankung explizit ausmacht.
Schuller erklärt: "Wenn wir dieses 'Tiefe Lernen' verwenden, können wir nicht eindeutig herausfinden, was der Computer erlernt hat. Es gibt Hunderttausende Parameter, die sich nicht so leicht zurück interpretieren lassen. Wir können sie aber vergleichen mit den uns bekannten Merkmalen, um dann eine Entscheidung zu treffen."
Unterscheidung zwischen Corona-Infektion und Erkältung
Die Unterscheidung von auf den ersten Blick ähnelnden Erkrankungen wie einer Erkältung und der Corona-Infektion ist nicht einfach, aber möglich. Bei einer klassischen Erkältung tritt, im Gegensatz zu einer Corona-Infektion, in der Regel eine verstopfte Nase auf. Das lässt sich in den Analysen klar abgrenzen und ist meistens schon mit bloßem Ohr beim Sprechen erkennbar. Merkmale wie eine raue Stimme oder längere Pausen beim Sprechen sind dagegen kennzeichnend für COVID-19.
"Die Sprachpausen sind länger und die Betroffenen sprechen dazwischen oft schneller, weil sie merken, dass sie Pausen machen und das Gespräch nicht verlieren möchten", sagt der Experte. "Die Stimmlippen schwingen außerdem asynchron und unregelmäßig. Aus diesen Erkenntnissen bilden wir Statistiken."
Daneben haben die Forscher auch eine Symptomerkennung in die Analysen mit einfließen lassen. Anhand der Häufigkeit, wie oft jemand husten oder niesen muss, lassen sich die Sprachdaten genauer als Erkältung oder COVID-19 einordnen.
"Unsere Datenlage ist noch nicht ideal. Eine Corona-Infektion kann mit verschiedenen Symptomen einhergehen, die sich verschieden anhören", sagte der Experte. So haben manche Personen gar keine Symptome, außer möglicherweise eine veränderte Stimme. "Wir haben allgemeine Daten mit vorliegender Diagnose, aber keine Unterscheidung nach Symptomen. Wir sind zuversichtlich, dass über die Vielzahl der gesammelten Daten die verschiedenen Fälle abgebildet sind, aber es ist zugegebenermaßen noch nicht kontrolliert genug", sagt der Professor für Künstliche Intelligenz und Digitale Gesundheit.
Corona per App erkennen: Wie geht es weiter?
Aber wie geht es nun weiter? Die Analysen werden verbessert, es wird ausgewertet und getestet. Aktuell liegt die Erkennungsrate bei mehr als 80 Prozent. Würde das System allerdings unter realistischeren Bedingungen im Alltag genutzt werden, müsste man davon ausgehen, dass die Trefferquote niedriger liegt.
Auch Täuschungsmanöver würden die Quote vermutlich drücken, da noch nicht feststeht, ob die Analysen betrugssicher sind. Denn das System müsste bei einem Einsatz mittels App auch Menschen erkennen, die es absichtlich täuschen möchten, beispielsweise wenn jemand absichtlich mit heiser Stimme spricht, um sich als erkrankt auszugeben oder eine vorhandene Corona-Infektion vertuschen möchte.
Verwendete Quellen:
- Gespräch mit Prof. Dr. Björn Schuller
- Universität Augsburg: Corona per SprachApp erkennen?
"So arbeitet die Redaktion" informiert Sie, wann und worüber wir berichten, wie wir mit Fehlern umgehen und woher unsere Inhalte stammen. Bei der Berichterstattung halten wir uns an die Richtlinien der Journalism Trust Initiative.