Stuttgarter unikurier Nr. 93 April 2004

Stuttgarter unikurier Nr. 94 Dezember 2004
Neue Projekte im Forschungsschwerpunktprogramm (2): Wie Emotionen in der Stimme messbar werden
Die Erfassung der Stimmgebung mit modernen signaltechnischen Methoden steht im Mittelpunkt eines weiteren vom Land Baden-Württemberg im Forschungsschwerpunktprogramm geförderten Projekts der Universität Stuttgart. Prof. Dr.-Ing. Bin Yang vom Lehrstuhl für Systemtheorie und Signalverarbeitung und Dr. techn. Wolfgang Wokurek vom Institut für Maschinelle Sprachverarbeitung befassen sich mit dem bislang kaum erforschten Gebiet der Stimmqualität der menschlichen Sprache. Das Projekt „Robuste Verfahren zur Schätzung der Stimmqualität mit Mikrofongruppen“ wurde von den Gutachtern für zwei Jahre bewilligt.

Als Stimmgebung bezeichnet man den zum Beispiel bei Vokalen (i, e, a, o, u, ä, ö, ü) und Diphthongen (ei, au, eu) im Kehlkopf erzeugten Teil der Sprache. Die Stimmgebung hat neben den hervorstechenden Merkmalen der Lautstärke und der Tonhöhe auch weitere qualitative Ausprägungen wie Krächzstimme, Normalstimme und „raue“ Stimme, also die Stimme beim Brüllen. Diese qualitativen Ausprägungen der menschlichen Stimme, die unter dem phonetischen Fachbegriff der Stimmqualität zusammengefasst werden, können auch quantitativ durch die Messung von Parametern ermittelt werden. Das zentrale Anliegen des neuen Forschungsprojekts ist die Verbesserung der eingesetzten Verfahren. Verbesserungen wollen die Wissenschaftler zunächst durch eine optimierte Aufnahmetechnik erreichen. Hier sollen Mikrofongruppen statt einem Mono- oder Stereomikrofon zum Einsatz kommen. Weitere Ansätze zur Optimierung liegen in einer verbesserten Signalvorverarbeitung und einer verbesserten Schätzung der Parameter. Als Schätzverfahren bezeichnet man die Messung statistisch modellierter Größen. Das Problem besteht vor allem darin, aus der gesprochenen Sprache genau die Parameter herauszufiltern, die für die Stimmqualität zuständig sind. Denn jede Ton-Aufzeichnung eines Sprechers wird durch eine Vielzahl anderer akustischer „Störungen“, die durch Rachen, Mund oder Nase erzeugt werden, „verunreinigt“. Auch die Wechselwirkungen mit der Raumakustik und weiterer äußerer Einflüsse müssen berücksichtigt werden. Ziel ist ein realitätsnahes oder „robustes“ Verfahren zur Erfassung der Stimmqualität, das auch außerhalb eines Tonstudios eingesetzt werden kann. Die neu entwickelten Verfahren können zum Beispiel in der automatischen Spracherkennung und in der Phoniatrie Anwendung finden. Bei der automatischen Spracherkennung sollen emotionelle Aspekte wie Zufriedenheit, Aufregung oder Ärger erkannt und bei der Dialogplanung eingesetzt werden. In der Phoniatrie ist die quantitative Erfassung der Stimmgebung ein wichtiger Bestandteil der Diagnose und der Qualitätskontrolle der Therapie von Stimmstörungen. KONTAKT Prof. Dr.-Ing. Bin Yang Lehrstuhl für Systemtheorie und Signalverarbeitung Tel. 0711/685 7330 e-mail: mail@lss.uni-stuttgart.de Dr. techn. Wolfgang Wokurek Institut für Maschinelle Sprachverarbeitung (IMS) Tel. 0711/121-1383 e-mail: wokurek@ims.uni-stuttgart.de

last change: 22.12.04 / yj
Pressestelle der Universität Stuttgart

Home Inhalt Suchen