ZuMult bei „Digitale Infrastrukturen für die Angewandte Linguistik“ (DIAL) auf der GAL in Dresden

ZuMult wird am 11.09. um 9:30 Uhr auf der GAL in Dresden bei einem Workshop des Hands-on-Forum des Forschungsfokus „Digitale Infrastrukturen für die Angewandte Linguistik“ (DIAL) vorgestellt.

Der Workshop führt in die Software-Architektur und die zugrunde liegenden Konzepte ein und gibt dann anhand von ausgesuchten Use-Cases eine praktische Demonstration der Arbeit mit der Plattform.

Ebenfalls basierend auf ZuMult haben Franziska Wallner und Matthias Schwendemann am Mittwoch um 16:30 Uhr einen Vortrag auf der regulären Tagung mit dem Titel „Klitisierungen als Vermittlungsgegenstand in Deutsch als Fremd- und 
Zweitsprache: Eine korpuslinguistische Analyse von 
Alltagskommunikation und Hörmaterialien aus Lehrwerken“

Das Programmheft mit näheren Informationen findet sich hier:
https://irp.cdn-website.com/895490cd/files/uploaded/240902_GAL24_Programmheft.pdf

ZuMult auf der DhD 2024 in Passau

Auf der Tagung der Digital Humanities im deutschsprachigen Raum in Passau (26.02. — 01.03.2024) waren Elena Frick und Henrike Helmer mit einen Posterbeitrag zu ZuMult vertreten.

Der Beitrag trägt den Titel:

Nutzergruppenspezifische Zugänge zu mündlichen Korpora aus dem Archiv für Gesprochenes Deutsch: neue Tools, neue Forschungsperspektiven

Das zugehörige Konferenz-Paper ist auf Zenodo verfügbar.

 Im Poster wird ein neues Tool für die Recherche nach Wiederholungen in der gesprochenen Sprache vorgestellt, das derzeit auf Basis der open source ZuMult-Architektur entwickelt wird. Das Konzept umfasst die Nutzung einer mächtigen korpuslinguistischen Suchanfragesprache in Kombination mit einem nutzerfreundlichen GUI-Filter, der speziell für die gesprächsanalytische Forschung entwickelt wurde und auf Spezifika von Gesprächskorpora ausgerichtet ist (z.B. durch die Berücksichtigung von Sprecherüberlappungen). Eine solche Funktion gab es bisher nicht für Korpora des gesprochenen Deutsch, so dass Wiederholungen von komplexen sprachlichen Formen in festlegbaren, relevanten pragmatischen Kontexten bisher mühsam manuell gesucht werden mussten.

ZuMult-Tools auf der Methodenmesse der 60. IDS-Jahrestagung

Das Poster zum Download

Auf der Methodenmesse der 60. IDS-Jahrestagung vom 05. bis 07. März  2024 war ZuMult mit einem Posterbeitrag vertreten.
In Form eines Werkstattberichts haben wir gezeigt, wie die  ZuMult-Tools zur Erforschung der gesprochenen Wissenschaftssprache  genutzt werden können.  Anhand von zwei Fallbeispielen (Klitisierungen  und argumentative Positionierungen) wurde der konkrete  Forschungsprozess bei der Analyse und Auswertung von Daten aus dem  GeWiss-Korpus veranschaulicht mit dem Ziel, Forschungswege sowohl für die engere als auch für die weitere Fachcommunity transparent und  replizierbar zu machen.

Neuer Beitrag in InfoDaF

Schwendemann, Matthias / Wallner, Franziska (2023): 

Mündlichkeitsphänomene in der gesprochenen Wissenschaftssprache: 
Korpuslinguistische Befunde und didaktische Perspektiven. 

Informationen Deutsch als Fremdsprache, Vol. 50 (Issue 5), pp.  505-524. 

https://doi.org/10.1515/infodaf-2023-0083

Der Beitrag untersucht Mündlichkeit in wissenschaftlichen Vorträgen von Sprecherinnen und Sprechern mit Deutsch als L1 aus dem GeWiss-Korpus und vergleicht diese mit Interaktionsdomänen aus dem Forschungs- und Lehrkorpus Gesprochenes Deutsch (FOLK). Zudem werden ausgewählte Mündlichkeitsphänomene (Abweichungen von der 
Standardlautung und die Verwendung von Modalpartikeln) in wissenschaftlichen Vorträgen analysiert. Umgesetzt wurden die Analysen mit Hilfe der im Projekt ZuMult entwickelten Tools ZuMal und ZuRecht. Abschließend wird im Beitrag gezeigt, wie Mündlichkeitsphänomene anhand authentischer Beispiele mit Hilfe der ZuMult-Tools im  Sprachunterricht veranschaulicht werden können.

KorDaF-Themenausgabe zu ZuMult

Christian Fandrych, Thomas Schmidt, Franziska Wallner, Kai Wörner (eds.):

Zugänge zu mündlichen Korpora für DaF und DaZ: Das ZuMult-Projekt.
KorDaF (Korpora Deutsch als Fremdsprache). Jahrgang 3 • Ausgabe 1 • 2023

https://kordaf.tujournals.ulb.tu-darmstadt.de/issue/92/info/

Mit einer Einführung zu technischen und methodischen Hintergründen, ausführlichen Beschreibungen von ZuMal, ZuRecht, ZuViel, ZuHand sowie Korpusporträts von FOLK und GeWiss.

ZuMult @ deRSE23 : Conference for Research Software Engineering in Germany

Elena Frick and Thomas Schmidt presented a poster on „Software Development for Working With Oral Corpora“ at the 2023 Conference for Research Software Engineering in Germany in Paderborn.

The current review of web applications providing access to spoken language corpora (Batinik et al. 2021) shows that platforms developed for different corpora often share the same functionalities, but use totally different technical basis strongly tied to the data format and user needs they were designed for. The poster presents the ZuMult solution – an open source three-tier software implementation with an object-oriented corpus data model, that can be flexibly used for a unified access to spoken language resources located in different repositories and be easily adapted to various corpus types and usage scenarios. Furthermore, the use of established standards like e.g. CQP, Lucene and ISO 24624:2016 provides a solid basis for sustainability.

Le Zu à Mult

On the occasion of the colloque « Qu’est-ce que (se) représenter la parole ? » in honour of Gabriel Bergounioux, the ZuMult project and tools were presented to a French audience of linguists at the Université d’Orléans on Friday, January 13. The presentation included a demonstration of the ZuMult architecture being applied to the „Enquête Sociolinguistique à Orléans“, also known as the ESLO corpus. The slides from the presentation can be downloaded here.

LREC 2022: New publication on ZuMult

Frick, Elena / Helmer, Henrike / Schmidt, Thomas (2022):
Querying Interaction Structure: Approaches to Overlap in Spoken Language Corpora.
Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022, Marseille, 20-25 June2022), 715–722.

In this paper, we address two problems in indexing and querying spoken language corpora with overlapping speaker contributions. First, we look into how token distance and token precedence can be measured when multiple primary data streams are available and when transcriptions happen to be tokenized, but are not synchronized with the sound at the level of individual tokens. We propose and experiment with a speaker-based search mode that enables any speaker’s transcription tier to be the basic tokenization layer whereby the contributions of other speakers are mapped to this given tier. Secondly, we address two distinct methods of how speaker overlaps can be captured in the TEI-based ISO Standard for Spoken Language Transcriptions (ISO 24624:2016) and how they can be queried by MTAS – an open source Lucene-based search engine for querying text with multilevel annotations. We illustrate the problems, introduce possible solutions and discuss their benefits and drawbacks.