Akustische Sprachsignalverbesserung bei der In-Car-Kommunikation

Kategorie: Forschung

v.l.n.r.: Prof. Dr.-Ing. Mohammed Krini, Stefan Ciba, M.Sc., Tim Schneider, B.Eng. und Matthias Herbert, B.Eng. mit einem Forschungsfahrzeug der Hochschule

Stefan Ciba M.Sc., wissenschaftlicher Mitarbeiter der TH AB, bei akustischen Versuchen zur Verbesserung der Sprachverständlichkeit mittels InterCom-System im Innenraum eines Forschungsfahrzeuges (Projekt Vespah)

Anwendungsnahe Forschungsprojekte im Bereich künstlicher Intelligenz und Signalverarbeitung an der TH AB vom BMBF und StMWK gefördert


Die TH Aschaffenburg bündelt ihre Kompetenzen im Bereich Künstlicher Intelligenz im sogenannten Kompetenzzentrum KI, dem Prof. Dr.-Ing. Mohammed Krini als eines der Gründungsmitglieder angehört. Im Labor für Signalverarbeitung und im von ihm geleiteten Labor für Audiokommunikation und Akustik findet – neben praktischen Lehrveranstaltungen für Studierende der ingenieurwissenschaftlichen Studiengänge – auch angewandte Forschung im Bereich der künstlichnr Intelligenz und der digitalen Signalverarbeitung unter Professor Krinis Leitung statt. 

Im Rahmen von Studien-, Bachelor- sowie Masterarbeiten haben Studierende die Möglichkeit, gemeinsam mit Projektingenieurinnen und -ingenieuren sowie wissenschaftlichen Mitarbeiterinnen und Mitarbeitern an Projekten mitzuwirken, zu forschen und eine kooperative Promotion anzustreben. Matthias Herbert, B.Eng. und Tim Schneider, B.Eng., sind aktuell als Projektingenieure angestellt und bearbeiten darüber hinaus ihre Masterthesis. Stefan Ciba, M.Sc. arbeitet als wissenschaftlicher Mitarbeiter und strebt mit seiner Forschung eine kooperative Promotion an. 

Entwicklung eines InterCom-Systems für Fahrzeuge
Im Rahmen des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Projektes Vespah wird ein echtzeitfähiges InterCom-System entwickelt. Dieses System ermöglicht es den Gesprächsteilnehmerinnen und -teilnehmern in einem fahrenden Auto, ein entspanntes Gespräch zu führen, ohne sich einander zuwenden zu müssen und selbst bei Vorhandensein von Fahrgeräuschen nicht lauter als gewöhnlich sprechen zu müssen. Für die praktischen Versuche stehen Equipment und ein Forschungsauto zur Verfügung. „Der Charme des Systems besteht darin, dass sich durch den gesteigerten Komfort gleichzeitig die Fahrsicherheit erhöht“, so das Forscherteam. 

Verbesserung der Sprachkommunikation während der Fahrt
Neue Methoden zur Sprachsignalverbesserung im fahrenden Auto werden im Projekt VerSpiFah, das vom Bayerischen Staatsministerium für Wissenschaft und Kunst (StMWK) gefördert wird, erforscht und entwickelt. Der Einsatz maschinellen Lernens und künstlicher Intelligenz birgt bei der Verbesserung von Sprachsignalen ein enormes Potential. Tiefe neuronale Netze werden mithilfe von Methoden des maschinellen Lernens auf gestörte Sprachdaten trainiert. Ziel ist es, selbst bei stark gestörten Signalen die Sprachverständlichkeit zu erhöhen und Sprachsignalanteile zu rekonstruieren, um eine verbesserte Sprachkommunikation während der Fahrt zu ermöglichen. Daneben werden neue modellbasierte Verfahren anhand klassischer statistischer Schätzmethoden und digitalem Filterdesign entwickelt. So zum Beispiel ein in der Masterarbeit von Matthias Herbert entwickelter Algorithmus zur Kompensation von Rückkopplungen. Eine Rückkopplungskompensation dient dazu, pfeifende Töne zu vermeiden, die entstehen, wenn ein Mikrofon sehr nah am dazugehörigen Lautsprecher platziert wird. Für ein InterCom-System, das im Innenraum eines Autos agiert, ist dies eine wichtige zu lösende Herausforderung.

Innovative Methoden mit vielfältigen Einsatzmöglichkeiten
Die entwickelten Methoden können in akustischen Systemen, wie zum Beispiel in Hörgeräten (Medizintechnik), aber auch in anderen industriellen Bereichen Anwendung finden. Beispielsweise bei der Mensch-Maschine-Interaktion (z.B. Sprachassistenten im Auto) ist es wichtig, dass Systeme bei Störgeräuschen ebenfalls zuverlässig funktionieren. Damit ein solches System noch stabiler gegen Störungen wird, sollen künftig zusätzlich visuelle Informationen für eine bessere Sprachkommunikation genutzt werden. Der Audiovisuelle Ansatz ist auch beim sicheren Autonomen Fahren äußerst sinnvoll, um zum Beispiel Gefahrensituationen zu erfassen (z.B. Richtungsortung einer herannahenden Sirene). Es bedarf dabei einer sogenannten akustischen Umfeld-Perzeption. Das bedeutet, dass das Auto ergänzend zu den Sensoren, die Objekte erkennen, mit der Fähigkeit des Hörens ausgestattet wird.