Am 10. Dezember von 13:15 bis 14:45 stellen wir den aktuellen Stand der Projektarbeit in einem virtuellen IDS-Kolloquium vor. Externe Gäste sind herzlich willkommen:
QUEST survey on multilingual/multimodal corpora
Asking for a friend… : The BMBF-funded project “QUEST: Quality – Established” is concerned with the development and use of curation criteria and quality standards for annotated language corpora.
QUEST is currently conducting a survey on quality and interoperability aspects of multimodal and/or multilingual corpora:
https://www.limesurvey.uni-hamburg.de/index.php/434519
QUEST is looking for users who have worked with multilingual and/or multimodal linguistic corpora, to gather information about their experiences. The results of the survey will help QUEST to develop curation criteria to improve the reuse potential of such corpora.
The topic is obyviously of great relevance also to the ZuMult project. Please join the survey and spread the news!
ZuMult-Vorstellung bei Workshop „in“ Siegen
Am 3. und 4. September fand der usrpünglich für März an der Universität Siegen geplante und dann von der Corona-Pandemie vereitelte Workshop „Datenaufbereitung und Visualisierung in der Variationslinguistik / Dialektologie“ als virtuelle Veranstaltung statt.
Thomas Schmidt hat dort in seinem Vortrag zur „Suche nach der optimalen Transkriptdarstellung“ auch die ZuMult-Prototypen zur Datenauswahl und zur Transkriptvisualisierung vorgestellt. Wir freuen uns, dass das Publikum, das hauptsächlich aus Forschenden in der Variationslinguistik und Sprachdokumentation bestand, diese Entwicklungen mit großem Interesse aufgenommen und sehr positiv kommentiert hat.
ZuMult paper in LREC Workshop proceedings
Our paper on „Using full text indices in querying spoken language corpora“ has now been published in the proceedings of the 8th Workshop on Challenges in the Management of Large Corpora (CMLC-8):
https://lrec2020.lrec-conf.org/media/proceedings/Workshops/Books/CMLC-8book.pdf
Article on Lexical Explorer
An article on Lexical Explorer, a tool providing access to FOLK and GeWiss data for lexical analyses, developed in the LeGeDe project, has just been published in Corpora:
Dolores Lemmenmeier-Batinić (2020): Lexical Explorer: extending access to the Database for Spoken German for user-specific purposes. In: Corpora 15 (1), 55-76.
ZuMult bei der DHd 2019
Bei der Tagung „Digital Humanities im deutschsprachigen Raum“, die im März dieses Jahres in Frankfurt/M. stattfand, hat das Mannheimer Teilprojekt die in ZuMult entwickelte Basis-Architektur auf einem Posterbeitrag präsentiert. Der Poster-Session ging ein Slam voraus, für den wir erstmalig die Projektziele in Gedichtform gefasst haben:
Um empirisch fundiert zu analysieren,
Wie Menschen sprechen und interagieren,
Erstellen Forscher Sprachkorpora verschiedener Sorten,
Zugänglich über Plattformen an verteilten Orten.
Wir möchten diese Daten miteinander verbinden
Und dafür geeignete Schnittstellen finden.
Wir erarbeiten daher eine Architektur
Mit der gängigen Drei-Ebenen-Struktur.
Wir haben ein Backendinterface definiert,
Korpusbestandteile als Objekte modelliert,
und Daten zur Query mit Lucene indiziert.
Als Zugang auf Architektur-Ebene drei
dient eine standardkonforme REST-API.
Wenn Sie unser Poster gleich besuchen,
Können Sie den Korpusbestand selbst durchsuchen.
Vielen Dank für Ihre Geduld,
wir seh’n uns am Poster vom Projekt ZuMult.
Für die DHd 2020 laufen bereits erste Planungen, die Spezifikation des ISO/TEI-Standards als Ballett aufzuführen.
CLARIN Survey of Spoken Language Corpora
In a next step of the CLARIN resource families initiative, CLARIN is conducting a survey on spoken language corpora. Feel free to add to or edit their Google Spreadsheet.
Preparatory User Study: User, who art thou?
In preparation of the ZuMult project, we conducted a systematic study on users of spoken language corpora. The results were presented and published:
- in a contribution to the DHD conference 2016 in Leipzig and
- in a contribution to the LREC conference 2016 in Portorož
With ZuMult now finally ready to act on the findings of that study, we are making available here also the slides and the poster presented on these occasions.
ZuMult: das Projekt stellt sich vor
Nach einigem Anfangs-ZuMult ist das Projektteam seit Februar 2018 komplett, und seit April befinden sich auch alle MitarbeiterInnen auf dem gleichen Kontinent. Das nehmen wir als Anlass, das Projekt kurz vorzustellen:
In ZuMult haben sich mit dem Hamburger Zentrum für Sprachwissenschaft (HZSK), dem Herder-Institut an der Universität Leipzig und dem Programmbereich Mündliche Korpora des Instituts für Deutsche Sprache (IDS) drei Partner zusammengeschlossen, die bereits auf eine mehrjährige Zusammenarbeit zurückblicken. Stellvertretend hierfür steht das GeWiss-Korpus, das in Leipzig mit Hilfe des in Hamburg entwickelten EXMARaLDA-Systems und rechtlich-methodischer Beratung aus Mannheim aufgebaut wurde. Die deutschsprachigen Bestandteile des Korpus sind seit September 2018 auch in die Datenbank für Gesprochenes Deutsch des IDS integriert.
Seit Beginn dieses Jahres fördert die DFG im LiS-Programm nun eine Fortführung dieser Zusammenarbeit „ZuMult: das Projekt stellt sich vor“ weiterlesen