Nach einigem Anfangs-ZuMult ist das Projektteam seit Februar 2018 komplett, und seit April befinden sich auch alle MitarbeiterInnen auf dem gleichen Kontinent. Das nehmen wir als Anlass, das Projekt kurz vorzustellen:
In ZuMult haben sich mit dem Hamburger Zentrum für Sprachwissenschaft (HZSK), dem Herder-Institut an der Universität Leipzig und dem Programmbereich Mündliche Korpora des Instituts für Deutsche Sprache (IDS) drei Partner zusammengeschlossen, die bereits auf eine mehrjährige Zusammenarbeit zurückblicken. Stellvertretend hierfür steht das GeWiss-Korpus, das in Leipzig mit Hilfe des in Hamburg entwickelten EXMARaLDA-Systems und rechtlich-methodischer Beratung aus Mannheim aufgebaut wurde. Die deutschsprachigen Bestandteile des Korpus sind seit September 2018 auch in die Datenbank für Gesprochenes Deutsch des IDS integriert.
Seit Beginn dieses Jahres fördert die DFG im LiS-Programm nun eine Fortführung dieser Zusammenarbeit unter dem Titel „Zugänge zu multimodalen Korpora gesprochener Sprache – Vernetzung und zielgruppenspezifische Ausdifferenzierung“. Damit wir auf das Projekt auch ohne eine zweistellige Tokenzahl Bezug nehmen können, haben wir uns auf das Akronym ZuMult geeinigt.
Korpora gesprochener Sprache bilden die empirische Basis zur Untersuchung vielfältiger Fragestellungen in der Linguistik (z.B. Gesprächsforschung, Soziolinguistik/Dialektologie, Phonetik/Phonologie, Korpuslexikographie), in der Sprachtechnologie und in weiteren wissenschaftlichen Disziplinen (z.B. qualitative Sozialforschung, Oral History Studies, Bildungsforschung). Die Bedingungen für die Arbeit mit solchen Daten haben sich in den letzten fünfzehn Jahren grundlegend gewandelt. So haben die Entwicklung von Korpustechnologie, die Etablierung von Standards und guten Praktiken, gezielte Initiativen zur Aufbereitung älterer Datenbestände, Projekte zum Aufbau neuer Korpora sowie die Einrichtung von Archiven und Distributionsplattformen dazu geführt, dass die sprachwissenschaftliche Forschung und Lehre nun erstmals in größerer Breite mit größeren Mengen gesprochensprachlicher Daten arbeiten kann.
Forschende, Lehrende und Studierende greifen auf diese Korpora in erster Linie über Web-Plattformen zu, die an verschiedenen Standorten entwickelt wurden und werden. Für die ZuMult-Partner sind dies die Datenbank für Gesprochenes Deutsch, das GeWiss-Korpus-Interface und das Repositorium des Hamburger Zentrums für Sprachkorpora. Alle diese Angebote werden bereits intensiv genutzt, wie etwa mehr als 8000 registrierte Nutzer bei der DGD zeigen. Allerdings hat eine im Vorfeld von ZuMult durchgeführte Nutzerstudie auch ergeben, dass viele konkrete Anwendungsszenarien von einer stärkeren Vernetzung und zielgruppenspezifischen Ausdifferenzierung der Plattformen profitieren würden.
Ziel von ZuMult ist daher, den Zugang zu Korpora gesprochener Sprache zunächst auf eine gemeinsame vernetzte Basis zu stellen und davon ausgehend Zugangswege zu entwickeln, die für die Bedarfe spezifischer Nutzergruppen optimiert sind. So soll es beispielsweise für einen DaF-Forscher einfacher werden, Daten mehrsprachiger Sprecher aus den Hamburger Beständen und monolinguale Referenz-Daten aus der DGD miteinander zu vergleichen, und eine entsprechend spezialisierte Anwendung soll das Zusammenstellen didaktisch geeigneter Beispiele für den Fremdsprachenunterricht erleichtern. Ein anderer zielgruppenspezifischer Zugangsweg kann z.B. einen Variationslinguisten dabei unterstützen, niederdeutsche Daten aus dem SiN-Korpus in Hamburg gemeinsam mit historischen Dialaktdaten aus dem Zwirner-Korpus am IDS quantitativ auszuwerten.
Das Projekt nähert sich diesem Ziel in drei Schritten: in der Konzeptionsphase werden zunächst eine technische Basisstruktur definiert und zwei konkrete Nutzungsszenarien ausgearbeitet. Die darauf folgende Implementierungsphase setzt die Konzepte praktisch um. Die Disseminationsphase sorgt abschließend für eine umfassende Dokumentation der Ergebnisse und macht stellt die erarbeiteten Lösungen den avisierten Nutzergruppen vor.
Über diesen Blog werden wir in unregelmäßigen Abständen über Fortschritte und Neuigkeiten in und um ZuMult berichten.