Dieses Bild zeigt

Digitale Analyse alter Dramen liest zwischen den Zeilen

Gegen den Strich gebürstet

Die Kombination von Computerlinguistik und Literaturwissenschaft analysiert 600 Dramen und macht somit auch die Inhalte von Werken außerhalb des literarischen Kanons zugänglich.
[Foto: Badisches Staatstheater]

Wie stark hat Shakespeare das deutsche Drama beeinflusst? Wie verändern sich Geschlechterrollen in Theaterstücken im Lauf der Epochen? Fragen, die zu beantworten für Literaturwissenschaftler zunächst Fleißarbeit bedeutet: Sie müssen jeden Text einzeln lesen und interpretieren. Dabei stoßen sie häufig schlicht an zeitliche Grenzen. Hier springt die Computerlinguistik ein: Mit ihren digitalen Werkzeugen lässt sich eine Vielzahl von Texten rasch analysieren. Das ist auch das Ziel zweier junger Forscher der Universität Stuttgart im Projekt QuaDramA.

Um sowohl für die Computerlinguistik als auch für die Literaturwissenschaft neue Forschungsergebnisse zu erzielen, haben Dr. Nils Reiter vom Institut für Maschinelle Sprachverarbeitung und Dr. Marcus Willand, Abteilung Neuere Deutsche Literatur II am Institut für Literaturwissenschaft, das Projekt Quantitative Drama Analytics, kurz QuaDramA, ins Leben gerufen. Darin wollen die beiden Mittdreißiger dramatische Texte untersuchen, genauer 600 Theaterstücke aus dem Zeitraum von 1740 bis 1920. „Aus literaturwissenschaftlicher Perspektive ist das Projekt deshalb spannend, weil wir in der Dramengeschichte bisher immer nur ausschnitthaft in die Literatur schauen konnten“, sagt Willand. „600 Texte sind schon sehr viel Material, um beispielsweise historische Verlaufsformen zu betrachten.“ Das Team will mit den Mitteln beider Fächer vor allem erforschen, welche Figurtypen in den Stücken vorkommen, wie diese interagieren und wie sie sich entwickeln. Neu an dieser Herangehensweise ist, dass sich die Dramen nicht nur interpretieren, sondern auch ihre Textmerkmale zählen oder messen lassen.

Literaturwissenschaftler meets Computerlinguist:  Marcus Willand (li.) und Nils Reiter.
Literaturwissenschaftler meets Computerlinguist: Marcus Willand (li.) und Nils Reiter.

„Diese Texte sind für die technische Seite interessant, weil sie sehr stark strukturiert sind“, sagt der Computerlinguist Reiter. „Wir haben Akte und Szenen, wir wissen, wer wann spricht.“ Dass jetzt auch literarische Texte in den Fokus maschineller Untersuchungen geraten, was bislang vor allem Zeitungsartikeln vorbehalten war, ist neu. Deshalb sollen für QuaDramA vorhandene Programme kombiniert und neue digitale Werkzeuge programmiert werden. Die Literaturwissenschaft habe sich lange Zeit auf wenige Werke der bedeutsamsten Autoren wie etwa Goethe, Schiller oder Gottsched fokussiert, so die Meinung des Literaturwissenschaftlers Willand. „Seit den 1970er-Jahren gibt es die Ambition, auch neben diesen Kanon zu schauen.“

Hier bietet sich auch für Reiter ein neuer Ansatz. Interessant wird es für ihn beim Vergleich von Figuren, wobei sich unweigerlich die Frage stellt, wer wem gegengestellt werden soll. „Also haben wir uns überlegt, dass wir Figurentypen brauchen, die nach Kategorien wie zum Beispiel Geschlecht oder Alter, aber auch nach der Rolle für die Handlung, der sozialen Rolle oder Ähnlichem entstanden sind.“

Analyse der Vaterrolle ist möglich

Wie also lassen sich dramatische Texte verwenden, um etwa für Historiker aufzuzeigen, welche Informationen sich zwischen den Zeilen verbergen? Wie hat sich beispielsweise die Vaterrolle im 18. Jahrhundert verändert und wann ist aus dem Patriarchen ein liebevoller Vater geworden? „Indem wir die Figuren vieler Werke einer Epoche analysieren, können wir besser nachvollziehen, wie sich die Gesellschaft verändert hat“, erklärt Willand.

Das Computer-Werkzeug soll die Figuren der Stücke in Typen ordnen, sodass Ähnlichkeiten und Veränderungen sichtbar werden, die bislang verborgen geblieben sind. „Bis 1750 spielen Tragödien immer im höfischen Umfeld, der Vater ist ein König oder Thronfolger“, erklärt Willand am Beispiel der Vaterrolle. „Dann wechselt es in ein bürgerliches Umfeld. Da ließe sich jetzt analysieren, mit wem der Vater vor allem spricht, mit den Söhnen oder den Töchtern? Und wie er spricht – mit einem eher zärtlichen oder eher in martialischem Vokabular?“

Mittels dieser Wortfeldanalysen werden thematische Tendenzen in einem Text untersucht.
Mittels dieser Wortfeldanalysen werden thematische Tendenzen in einem Text untersucht.

Aktuell arbeiten Reiter und Willand an einem Artikel zur Geltung William Shakespeares für das deutsche Drama. Sie gehen der Frage nach, wie der englische Dramatiker die Autoren der Sturm-und-Drang- Epoche in der zweiten Hälfte des 18. Jahrhunderts beeinflusste. „Die Sturm-und-Drang-Autoren sagen, Shakespeare lege seine Figuren so an, wie sie in der Natur vorkommen, also nicht künstlich“, sagt Willand. „Die Frage ist: Wie kann man das messen?“ Um dies zu beantworten, wollen die beiden Wissenschaftler statt reiner Strukturdaten auch linguistische Informationen heranziehen, etwa Redeanteile oder die Sprache der Figuren.

Wichtige Vorarbeit haben Reiter und Willand bereits geleistet: Sie entwickelten ein Vorgehen, das die Komplementierung von strukturellen Informationen mit einer computerlinguistisch unterstützten Analyse der Figurenreden erlaubt. Teil der modernen Arbeitsweise in den Digital Humanities ist, die Forschung mittels digitaler Vernetzung bereits im Prozess der Wissenschaftscommunity zugänglich zu machen. Die beiden Forscher nutzen dazu den Blog quadrama.github.io.

Doktoranden und Hiwis arbeiten an einem Programm

Dank einer Förderung durch die Volkswagen-Stiftung können die Forscher für QuaDramA zwei Doktoranden und einige wissenschaftliche Hilfskräfte einstellen. Sie sollen in den nächsten drei Jahren unter anderem ein Werkzeug programmieren, das Koreferenzen auflöst. Darunter versteht man beispielsweise, dass sich verschiedene Sprachkonstruktionen auf dieselbe Figur beziehen: Diese kann mit ihrem Namen benannt werden, mit ihrer Funktion wie „der Vater“ oder mit dem Personalpronomen. Der Computer soll lernen, diese Varianten über den Wechsel von Figuren, Szenen und Regieanweisungen hinweg präzise zuzuordnen.

Dazu markieren die Wissenschaftler in Texten entsprechende Stellen und füttern damit das Programm, das mit dem gelernten Wissen dann neue Texte durcharbeitet. Wenn die Forschergruppe die se Herausforderung gemeistert hat, ist sie ihrem Ziel ein Stück näher, Figurentypen in einer Vielzahl von Dramen automatisch zu identifizieren und zu analysieren. Mit den gewonnenen Informationen lassen sich dann wiederum die einzelnen Werke in ihrer Bedeutung für die Dramengeschichte einordnen – vielleicht sogar, ohne sie überhaupt je gelesen zu haben. Daniel Völpel

+-
  • Dr. Nils Reiter, Institut für Maschinelle Sprachverarbeitung, Tel. +49 711 685-81354, E-Mail, Website
  • Dr. Marcus Willand, Institut für Literaturwissenschaft, Neuere Deutsche Literatur II, Tel. +49 711 685-82784, E-Mail, Website
Dieses Bild zeigt Mayer-Grenu
 

Andrea Mayer-Grenu

Wissenschaftsreferentin; Forschungspublikationen