Vom „Wörterzählen“ zu den Digital Humanities

14. Mai 2019, Nr. 39

DFG bewilligt Fortsetzung für Projekt „Quantitative Literaturwissenschaft“ an der Universität Stuttgart

Digital Humanities (Digitale Geisteswissenschaften) sind heute ein Boomfach, doch ihre Vorgeschichte reicht weit zurück. Wie rechnerische Verfahren zur Analyse und Interpretation von Sprache und Literatur seit dem frühen 19. Jahrhundert verwendet wurden, erforscht das Projekt „Quantitative Literaturwissenschaft“ an der Universität Stuttgart, für das die Deutsche Forschungsgemeinschaft DFG jetzt die Fortsetzung bewilligt hat. In der kommenden Förderperiode möchte Projektleiter Dr. Toni Bernhart (Institut für Literaturwissenschaft, NDL II) die Pionierleistungen des Philosophen Max Bense sowie der Informatiker Rul Gunzenhäuser und Theo Lutz für die quantitative Literaturwissenschaft ergründen.

Schon im 19. Jahrhundert experimentierten Forscherinnen und Forscher damit, wie man durch Quantifizierung und statistische Standardisierung ästhetische, formale und inhaltliche Besonderheiten von Texten erfassen und erforschen kann. Doch bis weit ins 20. Jahrhundert galten solche Ansätze in den Geisteswissenschaften als Randphänomene, oftmals verunglimpft als „Wörterzählen“ oder schlichtweg nicht ernst genommen. Eher waren es Vertreter anderer Disziplinen, die sich damals mathematisch mit Literatur beschäftigten: Thomas Young zum Beispiel, bekannt für seine (erfolglosen) Versuche, mit Hilfe der Wahrscheinlichkeitsrechnung ägyptische Hieroglyphen zu ent-schlüsseln, war Arzt. Augustus De Morgan, der die Urheberschaft von Briefen des Apostels Paulus zu klären versuchte, war Mathematiker. Mit der unsicheren Urheberschaft von Shakespeare-Dramen beschäftigte sich ein Meteorologe, Thomas C. Mendenhall. Literaturwissenschaftler stempelten solche Experimente als kuriose Umtriebe fachfremder Dilettanten ab. Erst im 20. Jahrhundert und im Zuge der Digitalisierung bedienten sie sich selbst zunehmend – zunächst recht einfacher -  mathematischer Verfahren.

Zählmaschinen und „menschliche“ Computer

Untersuchen lassen sich mit Mathematik stilistische Phänomene im weitesten Sinne, also Merkmale, die spezifisch sind für einzelne Dichterinnen und Dichter, Epochen oder Gattungen. Bei großen Projekten setzte man anfangs meist auf Zählmaschinen oder „menschliche Computer“, Zähl- und Rechenassistenten, meist Frauen. „Die Effizienz der Forschungspraxis sowie der erforschte Materialumfang sind erstaunlich“, sagt Projektleiter Bernhart nach Abschluss der ersten Projektphase. Friedrich Kaeding zum Beispiel, der um 1890 das erste Häufigkeitswörterbuch der deutschen Sprache erstellt hat, untersuchte mit Hilfe von bis zu 1.000 unentgeltlich arbeitenden Personen elf Millionen Wörter. Dieser Umfang wurde erst 1972 am Rechenzentrum der Universität Hamburg übertroffen, mit damals modernster Lochkartentechnik.

Anfänge Künstlicher Intelligenz

Eine eminent wichtige Rolle für die Computerisierung der quantitativen Literaturwissenschaft im 20. Jahrhundert spielen zwei Professoren der Universität Stuttgart: der Mathematiker und Informatiker Rul Gunzenhäuser sowie der Philosoph und Wissenschaftstheoretiker Max Bense. Im gleichen Umfeld entstanden in den späten 1950er-Jahren auch die weltweit ersten computergenerierten lyrischen Texte von Theo Lutz, die einer Art der Schubumkehr gleichkamen: Wenn man Texte mithilfe statistischer Verfahren analysieren kann, so Lutz‘ Idee, dann muss es auch möglich sein, Texte mit statistische Verfahren künstlich herzustellen. Das ist im Kern der Anfang Künstlicher Intelligenz (KI).

In der nächsten Projektphase möchte Bernhart das Zusammenspiel von Mathematik, Informatik und Geisteswissenschaften in den 1950er und 1960er Jahren noch ausführlicher untersuchen. Gerade diese frühe Zeit war äußerst experimentier- und kooperationsfreudig und stellt einen wichtigen wissenschaftsgeschichtlichen Vorlauf an der Schwelle zu den modernen Digital Humanities dar. International herausragende Beispiele dafür sind die Stuttgarter Gruppe um Bense, Gunzenhäuser und Lutz, daneben auch eine bislang kaum beachtete Arbeitsgruppe an der RWTH Aachen, die vom Physiker Wilhelm Fucks geleitet wurde. Geplant sind zudem ein Buch „Quantitative Literaturwissenschaft“, das 2020 erscheinen soll, sowie eine Tagung zum Projektabschluss in Kooperation mit dem Deutschen Literaturarchiv (DLA) Marbach.

Das Projekt „Quantitative Literaturwissenschaft“ wurde 2015 am Institut für Literaturwissenschaft (NDL II) sowie am Stuttgart Research Centre for Text Studies der Universität Stuttgart eingerichtet und ist mit dem Studiengang Digital Humanities assoziiert. Die neue Förderphase reicht bis März 2020. Für die Durchführung des Projekts konnte Bernhart, der von der Freien Universität Berlin kommt, sich die Universität selbst auszusuchen. Er entschied sich für die Universität Stuttgart, „weil das exzellente Renommee der Stuttgarter Literaturwissenschaft, verbunden mit dem Forschungsschwerpunkt und Studiengang Digital Humanities sowie die Nähe zu den informatischen Fächern wie der Maschinellen Sprachverarbeitung eine ideale Arbeitsumgebung bilden.“

Fachlicher Kontakt:

PD Dr. Toni Bernhart, Universität Stuttgart, Institut für Literaturwissenschaft (NDL II), Tel.: +49 (0)711/685 83061, E-Mail

Medienkontakt

 

Hochschulkommunikation

Keplerstraße 7, 70174 Stuttgart

Zum Seitenanfang