Willkommen beim Zentrum für Nachhaltigkeit Linguistischer Daten (NaLiDa)

Sprachressourcen wie Korpora, Lexika, Grammatiken, Experimentaldaten oder Computerprogramme werden in der linguistischen Forschung immer wichtiger. Jedoch ist ihre Erstellung häufig sehr komplex, Informationen gehen auf lange Sicht verloren oder können nicht mehr verarbeitet werden. Das NaLiDa-Projekt am Seminar für Sprachwissenschaft (SfS) der Eberhard Karls Universität Tübingen beschäftigt sich damit, wie derartige Daten langfristig für Forschungsfragestellungen bereit gehalten werden können.

Im Fokus stehen dabei folgende Aspekte:

Sammeln von Ressourcen
Erfassen von Daten
Zugang zu den Daten
Rechtliche und ethische Aspekte der Langzeitarchivierung
Standards für Sprachressourcen
Beratung zu allen Aspekten der Datenhaltung digitaler Texte
Erstellung eines Migrationskonzepts zur Übergabe der Forschungsdaten aus dem fach-spezischen Repositorium in ein fach-übergreifendes Repositorium; Verbringen der Daten aus der Linguistik in die Infrastruktureinrichtung der Universität (innerhalb der 2. Förderphase).

Dokumentation

Wissenschaftler können vom NaLiDa-Zentrum Hilfestellung bei der Erstellung von Beschreibungen (Metadaten) für ihre Ressourcen und der Archivierung erhalten. So können sich Forscher ganz auf ihre Daten konzentrieren.

Katalog

Das Archiveren und Publizieren von Forschungsprimärdaten erfordert auch, dass man die Daten finden kann. Dazu dienen Kataloge, die auf Beschreibungen in Form von Metadaten beruhen und die öffentlich zugänglich sind.

Portal

Der Einstieg zu Sprachressourcen, die Beschreibung von gängigen Verfahren und die Sammlung von aktuellen Informationen stellen neben der Vernetzung von Ressourcenerstellern die grundlegenden Funktionen dieses Portals dar.