Willkommen beim Zentrum für Nachhaltigkeit Linguistischer Daten (NaLiDa)
Sprachressourcen wie Korpora, Lexika, Grammatiken, Experimentaldaten oder Computerprogramme werden in der linguistischen Forschung immer wichtiger. Jedoch ist ihre Erstellung häufig sehr komplex, Informationen gehen auf lange Sicht verloren oder können nicht mehr verarbeitet werden. Das NaLiDa-Projekt am Seminar für Sprachwissenschaft (SfS) der Eberhard Karls Universität Tübingen beschäftigt sich damit, wie derartige Daten langfristig für Forschungsfragestellungen bereit gehalten werden können.
Im Fokus stehen dabei folgende Aspekte:
- Sammeln von Ressourcen
- Erfassen von Daten
- Zugang zu den Daten
- Rechtliche und ethische Aspekte der Langzeitarchivierung
- Standards für Sprachressourcen
- Beratung zu allen Aspekten der Datenhaltung digitaler Texte
- Erstellung eines Migrationskonzepts zur Übergabe der Forschungsdaten aus dem fach-spezischen Repositorium in ein fach-übergreifendes Repositorium; Verbringen der Daten aus der Linguistik in die Infrastruktureinrichtung der Universität (innerhalb der 2. Förderphase).
Dokumentation
Wissenschaftler können vom NaLiDa-Zentrum Hilfestellung bei der Erstellung von Beschreibungen (Metadaten) für ihre Ressourcen und der Archivierung erhalten. So können sich Forscher ganz auf ihre Daten konzentrieren.
Katalog
Das Archiveren und Publizieren von Forschungsprimärdaten erfordert auch, dass man die Daten finden kann. Dazu dienen Kataloge, die auf Beschreibungen in Form von Metadaten beruhen und die öffentlich zugänglich sind.
Portal
Der Einstieg zu Sprachressourcen, die Beschreibung von gängigen Verfahren und die Sammlung von aktuellen Informationen stellen neben der Vernetzung von Ressourcenerstellern die grundlegenden Funktionen dieses Portals dar.