Als Stimmgebung bezeichnet man den zum Beispiel bei
Vokalen (i, e, a, o, u, ä, ö, ü) und Diphthongen (ei, au,
eu) im Kehlkopf erzeugten Teil der Sprache. Die Stimmgebung
hat neben den hervorstechenden Merkmalen der Lautstärke und
der Tonhöhe auch weitere qualitative Ausprägungen wie
Krächzstimme, Normalstimme und „raue“ Stimme, also die
Stimme beim Brüllen. Diese qualitativen Ausprägungen der
menschlichen Stimme, die unter dem phonetischen Fachbegriff
der Stimmqualität zusammengefasst werden, können auch
quantitativ durch die Messung von Parametern ermittelt
werden. Das zentrale Anliegen des neuen Forschungsprojekts
ist die Verbesserung der eingesetzten Verfahren.
Verbesserungen wollen die
Wissenschaftler zunächst durch eine optimierte
Aufnahmetechnik erreichen. Hier sollen Mikrofongruppen statt
einem Mono- oder Stereomikrofon zum Einsatz kommen. Weitere
Ansätze zur Optimierung liegen in einer verbesserten
Signalvorverarbeitung und einer verbesserten Schätzung der
Parameter. Als Schätzverfahren bezeichnet man die Messung
statistisch modellierter Größen. Das Problem besteht vor
allem darin, aus der gesprochenen Sprache genau die
Parameter herauszufiltern, die für die Stimmqualität
zuständig sind. Denn jede Ton-Aufzeichnung eines Sprechers
wird durch eine Vielzahl anderer akustischer „Störungen“,
die durch Rachen, Mund oder Nase erzeugt werden,
„verunreinigt“. Auch die Wechselwirkungen mit der
Raumakustik und weiterer äußerer Einflüsse müssen
berücksichtigt werden. Ziel ist ein realitätsnahes oder
„robustes“ Verfahren zur Erfassung der Stimmqualität, das
auch außerhalb eines Tonstudios eingesetzt werden kann. Die
neu entwickelten Verfahren können zum Beispiel in der
automatischen Spracherkennung und in der Phoniatrie
Anwendung finden. Bei der automatischen Spracherkennung
sollen emotionelle Aspekte wie Zufriedenheit, Aufregung oder
Ärger erkannt und bei der Dialogplanung eingesetzt werden.
In der Phoniatrie ist die quantitative Erfassung der
Stimmgebung ein wichtiger Bestandteil der Diagnose und der
Qualitätskontrolle der Therapie von Stimmstörungen.
KONTAKT
Prof. Dr.-Ing. Bin Yang
Lehrstuhl für Systemtheorie und Signalverarbeitung
Tel. 0711/685 7330
e-mail:
mail@lss.uni-stuttgart.de
Dr. techn. Wolfgang Wokurek
Institut für Maschinelle Sprachverarbeitung (IMS)
Tel. 0711/121-1383
e-mail:
wokurek@ims.uni-stuttgart.de