III. Modul A4: Grammatikformalismen und Parsing
Erstellung eines Moduls zum Thema constraintbasierte
Grammatikformalismen und syntaktische Verarbeitung (Parsing)
Ziel des hier beantragten
Projektes ist die Erstellung eines computerlinguistischen Lehrmoduls, das die
Verzahnung von linguistischer Theoriebildung, ihrer mathematischen Grundlegung
und der computerlinguistischen Implementierung und dazu notwendiger
Programmiermethodik thematisiert. Als linguistische Grundlage dient die
Head-Driven Phrase Structure Grammar (HPSG) als eine der linguistischen
Theorien mit der größten Bedeutung für die Computerlinguistik. Der Kurs führt
in die mathematischen Grundlagen solcher constraintbasierten
Grammatikformalismen ein und vermittelt die für die Formalisierung,
Implementierung und Verarbeitung von HPSG-Grammatikfragmenten in der Tradition
von Pollard und Sag (1994) notwendigen Kenntnisse an Hand konkreter
Beispielgrammatiken und ihrer Umsetzung. Die für die Kursgestaltung zentrale
Verbindung zwischen formalen und linguistischen Grundlagen und ihrer
Verarbeitung (constraintbasiertes Parsing) wird auf der praktischen Seite durch
die Grammatikimplementierungsumgebung TRALE gewährleistet, die speziell für die
theorienahe Implementierung von HPSG-Grammatiken entwickelt wurde. Die Art und
Weise der Verarbeitung von Grammatiken in TRALE soll durch ein User-Interface
visualisiert werden.
Die Grundidee des Kurses
besteht darin, den Teilnehmern die weitreichenden Verbindungen zwischen
linguistischer Wissensrepräsentation, mathematischen Theorien natürlicher
Sprache und modernen Programmiermethoden zu vermitteln. Dies geschieht auf drei
Ebenen:
Erstens durch die
konkrete Aufgabe, Grammatiken in einem bestimmten Formalismus und in einer
bestimmten Programmierumgebung zu implementieren. Bei einer derartigen Aufgabe handelt es sich um eine der
Grundaufgaben der Computerlinguistik, die anhand von praktischen Beispielen
eingeübt werden soll.
Zweitens ist die HPSG
ein Fallbeispiel par excellence für die Zusammenhänge zwischen den drei oben
genannten Fachgebieten. Die HPSG liefert eine außerordentlich erfolgreiche
Verbindung von computationell umsetzbaren sprachwissenschaftlichen Analysen mit
einer großen empirischen Abdeckung, die eine Vielzahl sprachlicher
Konstruktionen erfassen. Im Unterschied
zu anderen Grammatikframeworks verfügt die HPSG über vollständig ausformulierte
und wohlverstandene mathematische Grundlagen, die unabhängig sind von den
verschiedenen Implementierungsplattformen, die für HPSG-Grammatiken existieren.
Und schließlich sind Typed Feature Structures, die zur Implementierung von
HPSG-Grammatiken verwendet werden, in der Computerlinguistik weitverbreitet, so
daß die Studierenden hier mit einem formalen Konstrukt konfrontiert werden,
dessen Verständnis ihnen die Grundlage weiter Bereiche der Computerlinguistik
erschließt.
Drittens ergibt sich
durch eine Einführung in die Implementierung von HPSG-Grammatiken in natürlicher
Weise eine Einführung in Theorien des constraintbasierten Parsing, die von
grundlegenden Konzepten, wie sie etwa das Standardwerk von Gazdar und Mellish
(1990) vermittelt, bis hin zu aktuellen, linearisierungsbasierten
Parsingstrategien reichen. Linearisierungsbasierte Grammatiken zählen zu den
aktuellsten Forschungsgebieten innerhalb der HPSG, und für sie wurden mittlerweile
die ersten computationellen Lösungsansätze gefunden. Die in diesem Lehrmodul
verwendete Implementierungsplattform wird daher die Entwicklung von
linearisierungsbasierten HPSG-Grammatiken unterstützen. Es ist vorgesehen, als
Implementierungsplattform das am Seminar für Sprachwissenschaft in Tübingen
entwickelte TRALE-System zu verwenden (siehe den Abschnitt ”eigene Vorarbeiten”
für weitere Ausführungen zu TRALE).
Um die genannten Inhalte
in didaktisch angemessener Weise im Format des webbasierten Trainings (WBT)
vermitteln zu können, müssen die notwendigen Kursmaterialien bereitgestellt und
existierende Software auf die spezielle Lernumgebung und Bedürfnisse des
Lehrformats angepaßt werden. Außerdem sind die Implementierungsplattform und
die mit ihr verbundenen Werkzeuge zu dokumentieren. Im einzelnen handelt es
sich dabei um folgende Arbeitspakete.
I. Erstellen von WWW-Kursmaterial für webbasiertes Training, bestehend aus
folgenden Submodulen:
·
Mathematische
Grundlagen der HPSG
·
Einführung
in constraintbasiertes Parsing
·
Einführung
in das TRALE-System und seine Komponenten
·
Schrittweise
Entwicklung komplexer Grammatiken
Dabei ist darauf zu
achten, die einzelnen Teile so modular wie möglich aufzubauen, so daß Interessenten
die Bestandteile dieses Kurses auch weitgehend unabhängig voneinander verwenden
können. Dieses Ziel soll unter anderem durch Vernetzung dieser elektronischen
Kursmaterialien untereinander und mit der Softwaredokumentation, die unter II.
ausgeführt wird, mittels Hyperlinks umgesetzt werden.
Das Kursmaterial wird
für das Lehrszenario des WBT in Einheiten unterteilt werden, die dem selbstgesteuerten
Lernen angemessen sind. Außerdem sollen seine Bestandteile als Lehrhilfe für
traditionelle Präsenzveranstaltungen geeignet sein. Das Kursmaterial der oben
genannten Submodule setzt sich jeweils aus sechs verschiedenen Quellen
zusammen:
·
Lehrtext,
·
Referenzhandbuch
zu Typed Feature Logic und HPSG, welches mit dem anderen Lehrmaterial verlinkt
ist,
·
Benutzerhandbuch
für TRALE
·
Systemdokumentation,
·
Annotierter
Quellcode von TRALE,
·
Annotierter
Quellcode der Lehrgrammatiken.
Das Benutzerhandbuch
enthält eine schrittweise Einführung in die TRALE-Software für Erstbenutzer
anhand von Beispielen. Das Referenzhandbuch besteht aus den Definitionen der
Syntax der verwendeten formalen Sprachen mit umfassenden Zusammenfassungen der
einschlägigen Begriffe und einem Index. Das Referenzhandbuch setzt ein
Grundwissen über das System voraus, das vom Benutzerhandbuch und vom
Lehrmaterial vermittelt wird.
Alle sechs Quellen des
Kursmaterials werden über ein HTML/XML-kompatibles, emacsbasiertes
Textverarbeitungsprogramm zugänglich sein, in dem auch der
Source-Level-Debugger von TRALE arbeiten wird.
Ein besonderes Merkmal
der Kursmaterialien wird sein, daß in ihnen fünf verschiedene Arten von Links
unterschieden werden, die damit in hervorragender Weise den Zusammenhang
zwischen den linguistischen, computationellen und mathematischen Quellen
repräsentieren werden, die dem hier behandelten interdisziplinären Arbeits- und
Forschungsgebiet zugrunde liegen. Die fünf Arten von Links sind die folgenden:
·
Konzeptuelle
und taxonomische Links: Sie verbinden die Vorkommen von Schlüsselkonzepten und Schlüsselausdrücken im gesamten
Kursmaterial einschließlich ihrer
Definitionen und Angaben zu ihrer Herkunft.
·
Empirische
Kontextlinks: Sie verbinden Designentscheidungen, Algorithmen und formale Definitionen mit enzyklopädischen
Darstellungen ihrer linguistischen
Motivation und empirischen Signifikanz.
·
Denotationelle
Links: Sie verbinden sowohl Vorkommen von Ausdrücken zur Bezeichnung von Konstruktionen und
linguistischen Problemstellungen als
auch Korrektheitsbedingungen von Algorithmen mit denjenigen mathematischen Definitionen, die diese
Ausdrücke und Bedingungen innerhalb der logischen Grundlagen der HPSG formalisieren.
·
Operationelle
Links: Sie verbinden mathematische Definitionen und das Auftreten darauf bezogener linguistischer Diskussionen
mit computationellem Lehrmaterial, das
die Algorithmen beschreibt, die
verwendet werden, um die formalen Objekte, die jene in einem praktischen System repräsentieren, zu konstruieren, zu
falsifizieren oder zu transformieren.
·
Implementierungslinks:
Sie verbinden theoretische Diskussionen von
Algorithmen mit dem tatsächlichen Quellcode des TRALE-Systems, der
sie implementiert, und mathematische Definitionen
und Diskussionen linguistischer
Konstruktionen mit dem tatsächlichen, annotierten Quellcode der Grammatik, der sie in einer typischen
Implementierung repräsentiert.
II. Bereitstellung der
Grammatikimplementierungsumgebung zur
Erarbeitung und praktischen Umsetzung des Lernstoffes
·
Bereitstellung
von TRALE für die Kursteilnehmer. TRALE beinhaltet für die Lehrumgebung: gaphische Lehr- und Debuggingwerkzeuge auf
Source-Level von TRALE und auf Grammatiklevel zur Förderung
des Verständnisses des im Vordergrund stehenden
Zusammenhangs zwischen linguistischer
Theorie und ihrer computerlinguistischen Präzisierung und Umsetzung
·
Dokumentation
von TRALE, die vollständing in sich mit
Hyperlinks strukturiert und mit dem Kursmaterial vernetzt ist:
·
Anwenderhandbuch
·
Referenzhandbuch
zu Typed Feature Logic und HPSG
·
Dokumentierte
Grammatiken für und in Englisch und Deutsch
·
Dokumentierter
TRALE-Code.
Bei der Bereitstellung von
TRALE muß evaluiert werden, ob das System auf einem zentralen Server zur
Verfügung gestellt werden und über das WWW betrieben werden kann, oder ob
Beschränkungen der Java-Applet Architektur den Betrieb über das Netz zu langsam
und anfällig gestalten würden. In diesem Falle müßten lokale Lösungen für die
Benutzer gefunden werden, indem die Installation auf den lokalen Systemen
sowohl technisch als auch beratend unterstützt wird.
TRALE wird so in die
graphische Benutzerumgebung des Lehrmoduls eingearbeitet, dass Fehlermeldungen
des Systems über die relevanten der oben beschriebenen Arten von Links
anklickbar sind. Die Verlinkung mit dem Lehrmaterial und den Handbüchern
erlaubt es dann, die gewünschte Information zur Fehlermeldung im Browserfenster
abzurufen.
Wichtiger Bestandteil
des Lehrmoduls sind Übungsaufgaben, welche die Teilnehmer dem Tutor des Kurses
einreichen müssen und auf die sie persönliche Rückmeldung erhalten. Außerdem
wird eine Newsgroup eingerichtet, in der die Teilnehmer Fragen stellen und ihre
Erfahrungen austauschen können. Das Material der Newsgroup soll verwendet
werden, um den Kurs zu evaluieren und zu verbessern, aber auch, um die
häufigsten Fragen und Antworten in entsprechendem kursbegleitendem Material für
spätere Kurse zur Verfügung zu stellen.
Lehre. Der hier geplante
netzbasierte Kurs geht von Seiten der Lehre auf mehrfach erprobte Vorläuferkurse
zurück, die bereits als Seminare und als Kurse auf Sommerschulen im In- und
Ausland angeboten wurden. Die Erfahrungen, die dabei gesammelt wurden, fließen
unmittelbar in die Gestaltung des Kurses ein, wobei zum einen ergänzend die
Resultate der neusten Forschung und zum anderen die zusätzlichen Anforderungen
des virtuellen Mediums didaktisch berücksichtigt werden müssen. Nähere Details
zu diesen Kursen sind in der allgemeinen Beschreibung zu den Tübinger
Lehrmodulen ausgeführt.
Software. Auf Seiten der Software
liegt mit TRALE ein am Seminar für Sprachwissenschaft entwickeltes
vollständiges Implementierungswerkzeug für HPSG-Grammatiken vor, das die
wichtigsten Eigenschaften, die den meisten HPSG-Grammtiken gemeinsam sind---wie
zum Beispiel Phrasenstrukturbäume---beim Parsing speziell unterstützt. Es wurde
in herkömmlichen Seminaren zur Grammatikentwicklung und in Forschungsprojekten
zu Grammatikfragmenten des Deutschen bereits erfolgreich eingesetzt. Ein
beträchtlicher Anteil der am Seminar für Sprachwissenschaft existierenden
Materialien zur Einführung in die Implementierung von HPSG-Grammatiken kann mit
entsprechenden Modifikationen für eine auf TRALE basierende Einführung
verwendet werden. Das TRALE-System wurde in erster Linie von Gerald Penn auf
der Basis seiner Erfahrungen mit dem ALE-System (Carpenter und Penn 1996) unter
Berücksichtigung von Eigenschaften der ConTroll-Implementeriungsplattform für
HPSG-Grammatiken (Götz und Meurers 1997, 1999) entwickelt und implementiert.
Als Vorbild der zu
entwickelnden, netzbasierten graphischen Oberfläche von TRALE dienen die
graphischen Implementierungswerkzeuge von ConTroll. Das interne Datenformat von
TRALE und ConTroll sind sich hinreichend ähnlich, um eine Übertragbarkeit der
Tools des einen Systems auf das andere möglich zu machen, insbesondere da
beabsichtigt ist, die Entwickler der entsprechenden Tools durch die Vergabe von
Unteraufträgen in die Arbeit einzubinden und so einen großen Aufwand an
Einarbeitungszeit zu vermeiden.
Der Übergang vom
ConTroll-System, das dem in der allgemeinen Tübinger Beschreibung der in die
Lehrmodule einfließenden Lehrerfahrungen erwähnten Kurs von Meurers und
Hinrichs zugrunde lag, auf das TRALE-System ist durch jüngste wissenschaftliche
Entwicklungen und strategische Überlegungen zur Nachhaltigkeit des Moduls
begründet. Das Vorläufersystem von TRALE, ALE, ist eines der am weitesten
verbreiteten Systeme zur Entwicklung von HPSG-Grammatiken und kommt an über 150
Universitäten und Forschungszentren weltweit zum Einsatz. Es ist zu erwarten,
daß dies die Akzeptanz und Breitenwirkung von TRALE erheblich fördern wird.
TRALE beinhaltet eine über ALE hinausgehende Funktionalität, die speziell der
Implementierung von HPSG-Grammatiken zugute kommt. Dabei handelt es sich insbesondere um eine computationell
effiziente Kompilierung von komplexen Antezdentien und von Typing in
linguistischen Prinzipien. In der jüngsten Entwicklung der systeminternen
Kodierung von Typed Feature Structures erzielt das System Parsingresultate, die
bezüglich der HPSG-Rerferenzgrammatiken 350fach schneller sind als mit ALE 3.0,
und die auf der jüngsten Referenzgrammatik von Bell Laboratories circa
113000fach schneller sind (Penn und Carpenter, 1999). Damit wird mit diesem
System die Verarbeitung von großen Grammatiken auf der Grundlage von Typed
Feature Structures in Echtzeit möglich.
Die Erstellung des Moduls
unterteilt sich in die Erstellung des didaktischen Konzepts und seiner
Umsetzung im WWW-basierten Kursmaterial und die Bereitstellung der graphischen
Grammatikimplementierungsumgebung TRALE zur praktischen Umsetzung und Erprobung
der zu erlernenden Grammatikimplementierungs- und Verarbeitungstechniken.
Während die Koordination der Arbeiten und die Erstellung des Lehrmoduls in
Tübingen angesiedelt sind, soll die Grammatikimplementierungsumgebung über
Unteraufträge an die Anforderungen des Lehrmoduls angepaßt werden. Die
Unteraufträge sollen an die an die bisherigen Entwickler des Systems, nämlich
an Prof. Dr. Detmar Meurers an der Ohio State University (OSU) und an Prof. Dr.
Gerald Penn an der University of Toronto vergeben werden.
Im folgenden werden
zunächst die Unteraufträge aufgeschlüsselt und begründet, bevor der Tübinger
Arbeitsplan knapp skizziert wird.
Im Einzelnen umfassen die Unteraufträge
sowohl die Bereitstellung des Grammatikimplementierungssystems mit einer
graphischen Benutzungsoberfläche zur Interaktion mit den Merkmals- und
Baumdatenstrukturen als auch die Dokumentation dieses Systems und die
Bereitstellung von Beispielgrammatiken zur Erarbeitung und Illustration der
Kursinhalte. Zur inhaltlichen Komplettierung des oben erwähnten Kurses von
Erhard Hinrichs und Detmar Meurers muß das TRALE-System von den Subkontraktoren
um eine Reihe von Komponenten erweitert werden. Die inhaltliche Komplettierung
ist insbesondere für den neuen, stärker individualisierten Lernkontext im
virtuellen Seminar von zentraler Bedeutung, da hierbei stärker als bei der
traditionellen Seminarform auf individuelle Interessen und
Vertiefungsmöglichkeiten bzw. individuelle Taktung des Lernfortschritts
eingegangen werden können sollte, um die Möglichkeiten des neuen Mediums
sinnvoll nutzen zu können. Folgende Komponenten sind hierbei von den
Subkontraktoren bereitzustellen und in die Gesamtarchitektur zu integrieren.
Source-level Interaktion
mit dem System insbesondere beim Debuggen (Toronto). Das derzeitige TRALE-System
wurde für die effiziente und daher maschinennahe Verarbeitung von
HPSG-Gramatiken implementiert. Für den Lehr- und Lernkontext ist daher eine
Modifikation der Interaktionsmöglichkeit mit dem System notwendig, die es dem
Lernenden ermöglicht, die Verarbeitung auf der Ebene der spezifizierten
Grammatik (statt des kompilierten Codes) nachzuvollziehen und zu beeinflussen.
Hierfür soll ein Source-Level-Debugger in das System eingebaut und mit dem
graphischen Benutzerinterface integriert werden.
Lexikalische-Regel-Komponente
(OSU). Mechanismen
zur Generalisierung über lexikalische Regularitäten sind ein zentraler
Bestandteil der HPSG-Architektur. Die für die sogenannten horizontalen
Regularitäten verwendeten Lexikalischen Regeln werden jedoch bisher nicht
adäquat vom TRALE-System abgedeckt. Unter Verwendung des im ConTroll-System
umgesetzten Lexikalischen-Regel-Compilers von Meurers und Minnen (1997) soll
das TRALE-System um eine für die Anforderungen des Unterrichts adäquate
Lexikalische Regelkomponente erweitert werden. Das Submodul ”lexikalische
Regeln” soll darüber hinaus mit einem inhaltlich verwandten Submodul des Kurses
”Computerlexikographie” vernetzt werden. Während im Kurs
”Computerlexikographie” lexikalische Regeln in allgemeiner Form dargestellt
werden, liegt mit dem Submodul dieses Kurses eine spezifische Instantiierung
vor.
Linearisierungsparserkomponente
(OSU + Toronto). Die
sogennanten Linearisierungsansätze sind ein zentraler Punkt in der Entwicklung
der HPSG. Für den Lehrkontext ist dieser Punkt von besonderem Interesse, da er
es ermöglicht, das traditionelle Konzept von Phrasenstruktur und ihrer
Verarbeitung zu hinterfragen und so besser zu verstehen. Um die Grundlage für
eine Diskussion dieses Themas zu schaffen, sollen ein Linearisierungsparser in
TRALE integriert und die aus einem solchen Liniearierungsmodul entstehenden
Möglichkeiten an Hand von Beispielgrammatiken illustriert werden. Hierfür ist
eine Kooperation zwischen OSU und U. of Toronto vorgesehen: So soll zum einen
auf die formalen und algorithmischen Grundlagen zurückgegriffen werden, für die
auf Basis von Götz und Penn (1997) und (Suhre 1999) die U. of Toronto
verantwortlich zeichnen soll; zum anderen soll das Design von
Linearisierungsgrammatiken für didaktische Zwecke auf Basis der in Fouvry und
Meurers (2000) beschriebenen Umsetzung an der OSU stattfinden. Dabei ist anzumerken,
daß in dieser Hinsicht an der OSU eine lange Tradition besteht, da dort bereits
seit langem u.a. im Rahmen eines NSF-Projektes an solchen Grammatiken
gearbeitet und über die Konsequenzen ihrer Realisierung in rechnergestützten
Architekturen nachgedacht worden ist.
Adaption der
Benutzerschnittstelle des Systems und seiner Dokumentation (Toronto). Die
System-Benutzerinteraktion des TRALE-Systems wurde bislang mit Blick auf einen
Forschungskontext konzipiert und ist daher für die nun avisierte Lehrverwendung
zu erweitern. Ziel ist es, das System in der Benutzerinteraktion so robust wie
möglich zu machen und mit einem detaillierten Benutzerhandbuch zu versehen.
Grammatikadaption (OSU). Zur Verwendung des
Grammatikmaterials aus dem bereits erwähnten Kurs von Hinrichs und Meurers sind
die Beispielgrammatiken an das TRALE-System anzupassen. Diese Aufgabe ist
sinnvollerweise vom Ko-Entwickler des ursprünglichen Kurses an der OSU zu
leisten.
Begründung der Vergabe der Unteraufträge
Aus einer Vielzahl von
Gründen sind die vorgesehenen Partner an der Ohio State University, Columbus, Ohio
(USA) und an der University of Toronto, Toronto, Ontario (Canada) die einzigen,
die für die Vergabe der vorgesehenen Unteraufträge in Frage kommen.
Die beiden
Verantwortlichen für die Unteraufträge an OSU und der University of Toronto,
Prof. Dr. Detmar Meurers und Prof. Dr. Gerald Penn, sind unmittelbar für den
Stand der Forschung verantwortlich, auf der dieses Lehrmodul aufbaut (siehe
auch die Auswahlbibliographie), und sie sind damit am besten dafür
qualifiziert, dieses Material in eine webbasierte Lehrumgebung umzusetzen.
Prof. Dr. Meurers ist einer der Autoren des ConTroll-basierten
HPSG-Implementierungskurses, auf dem die Struktur des hier vorgestellten
Lehrmoduls beruht. Prof. Dr. Gerald Penn ist der Hauptentwickler von ALE und
von TRALE. Mit Herrn Meurers und Herrn Penn besteht eine lange und enge
Kooperation, in deren Rahmen die oben beschriebenen Systeme entwickelt wurden.
Da es sich bei ihnen durchweg um die Originalautoren handelt, entfällt jegliche
Einarbeitungszeit in die einschlägige Software, und die notwendigen Anpassungen
an die Lehrumgebung und die Erstellung der eingehenden Anwendungen zum Beispiel
in Form von Lehrgrammatiken kann so am effizientesten geleistet werden. In
diesem Zusammenhang ist darauf hinzuweisen, dass OSU eines der führenden
Zentren auf dem Gebiet der Entwicklung der Theorie und der computationellen
Implementierung von Linearisierungsgrammatiken im Rahmen der HPSG ist.
Darüber hinaus befinden
sich das Computer Science Department der University of Toronto, das weltweit führend
auf dem Gebiet der künstlichen Intelligenz ist, und das Linguistics Department
der OSU unter den Top 10 in Nordamerika. Eine Zusammenarbeit mit ihnen ist
prestigeträchtig, verleiht dem Projekt im Sinne der Nachhaltigkeit Bekanntheit
und Breitenwirkung und gibt ihm Zugang zu den weltweit qualifiziertesten
Nachwuchswissenschaftlern, die an seiner Entwicklung arbeiten und das
Lehrmaterial testen werden. Es handelt sich damit um die ideale Entwicklungsumgebung
für eine neue Generation von Lehrwerkzeugen.
Von OSU und der
University of Toronto liegen Zusagen vor, daß der Kurs während der Projektlaufzeit
simultan an den drei an der Entwicklung beteiligten Universitäten unterrichtet
werden wird, was eine schnelle, intensive und gründliche Überarbeitung und
Verbesserung des Lehrmoduls in seiner Entwicklungsphase erlauben wird. Der
dreifache Unterricht findet darüber hinaus in drei verschiedenen Lehrumgebungen
statt, nämlich an einem Computer Science Department, an einem renommierten
Linguistics Department für PhD-Studierende, und an einem Computerlinguistikinstitut
mit MA-Studierenden. Es ist zu erwarten, daß dies zu signifikant verschiedenen
Rückmeldungen von Seiten der Studierenden führen wird, die bei der Verbesserung
des Lehrmoduls von beträchtlichem Nutzen sein werden.
Der Standort OSU denkt
außerdem darüber nach, den Kurs in Form einer medienunterstützten Präsenzveranstaltung
anzubieten. Dieses alternative Format ergäbe somit im Vergleich zum WBT
wiederum wichtige Information anderer Art über die Eigenschaften des
Kursmaterials.
Bei dem hier
vorgeschlagenen Lehrmodul handelt es sich um ein äußerst ehrgeiziges, umfangreiches
und wissenschaftlich anspruchsvolles Projekt, in dem auf der Ebene von
Spitzenforschung Neuland in der Lehre betreten wird, indem neuste Resultate in
anschaulicher Weise zugänglich gemacht werden sollen. Dies ist letzten Endes
nur durch enge Zusammenarbeit mit den auf den jeweiligen Gebieten führenden
Universitäten zu realisieren.
Bei der Vergabe von
Unteraufträgen an die Ohio State University in Columbus, Ohio, in den USA und
an die University of Toronto in Toronto, Ontario, in Kanada zu jeweils DM
90.000 für umfangreiche Software- und Grammatikentwicklung sowie zur
Dokumentation dieser Produkte in Form von mit Hyperlinks vernetztem
Lehrmaterial ist weiterhin anzumerken, daß beide Standorte davon jeweils eine
Stelle finanzieren. In Deutschland entspräche die dafür in Frage kommende halbe
BAT IIa-Stelle einem Kostenaufwand von ca. DM 50.000, wohingegen in Ohio dafür
DM 40.000 anfallen. Neben der oben ausgeführten sachlichen Notwendigkeit der
Vergabe der Unteraufträge an die beiden genannten Universitäten ergibt sich
somit durch die Auslagerung der Aufgaben eine finanzielle Ersparnis von 20%.
Dabei tragen die Unterauftragnehmer in Nordamerika das Wechselkursrisiko.
Koordination der
Arbeiten an den drei Entwicklungsstandorten, Erstellung und Integration des im
Abschnitt Arbeitsziele näher charakterisierten, hochgradig verlinkten
Lehrmaterials, didaktische Gesamtkonzeption des Lehrmoduls, Vorbereitung und
Teilnahme an 2 Workshops des Konsortiums im Frühjahr und Herbst 2002, sowie
Vorbereitung und Teilnahme an der Sommerschule 2003 mit Vorstellung des
Gesamtmoduls.
Die Aufgaben der
Studentischen Hilfskraft bestehen im Übersetzen des Lehrmaterials je nach der
jeweils vorliegenden Ausgangssprache entweder vom Deutschen ins Englische oder
vom Englischen ins Deutsche, im systematischen Testen der Lehrsoftware, in
einfachen Programmieraufgaben wie zum Beispiel der Erweiterung von Lexika der
zu implementierenden Lehrgrammatiken sowie in der Unterstützung der
Vorbereitung der beiden Workshops und der Sommerschule.
Das hier vorgestellte
Modul entspricht in seinem Umfang einem Hauptseminar von 4 SWS mit seminarbegleitender
zweistündiger Übung und zweistündigem begleitendem Selbststudium pro Woche.
Damit ergibt sich als Gesamtsumme eine effektive Lernzeit von 8 Stunden pro
Woche. Das Modul hat das Format des
webbasierten Trainings. Dabei ist zu beachten, daß die Integration von
mathematischen Grundlagen der Linguistik, der Vertiefung eines grammatischen
Frameworks (HPSG) und des Erlernens computerlinguistischer Techniken der
Grammatikentwicklung in einem Kurs in der hier vorgestellten Form erst durch
die Nutzung des virtuellen Seminarformats möglich wird. Dies geschieht hier
dadurch, daß mathematische Konzepte und die Struktur der HPSG sofort an
graphischen Benutzeroberflächen und mit vorbereiteten Beispielgrammatiken
verdeutlicht werden, und somit von vornherein eine hochgradige Integration der
drei Themenbereiche Linguistische Repräsentation, Mathematische Grundlagen und
Computerlinguistik erreicht wird, die im herkömmlichen Seminarformat nur schwer
zu erzielen ist. Hierin liegt der spezifische Mehrwert des Einsatzes der neuen
Medien. Dies sollte auch dazu führen, daß der Kurs von Teilnehmern, die in
einzelnen Teilbereichen (wie etwa der mathematischen Grundlagen) Vorkenntnisse
mitbringen, mit Gewinn durchlaufen werden kann.
Erwartete Anzahl an Kursteilnehmern. Es wird erwartet, daß
der Kurs in der ersten Anwendungsphase in Tübingen, in Toronto, und in Columbus
von jeweils etwa 10 Studierenden belegt wird, so daß durch das Kursangebot an
drei verschiedenen Standorten zunächst mit insgesamt etwa 30 Studierenden pro
Semester, in dem der Kurs angeboten wird, gerechnet wird. Diese Zahl wird sich
erhöhen, sobald weitere Standorte innerhalb des Konsortiums an der
Lehrveranstaltung teilnehmen. Wir gehen davon aus, dass der Kurs mindestens in
Saarbrücken, Bonn und Osnabrück importiert wird.
Carpenter, B. und G. Penn (1996): Efficient Parsing of
Compiled Typed Attribute Value Logic Grammars.
In H. Bunt and M. Tomita (Hg.), Recent Advances in Parsing Technology.
Kluwer.
Fouvry, Frederik und Detmar Meurers (2000): Towards a
platform for linearization grammars. In: E. W. Hinrichs, D. Meurers, und S.
Wintner (Hg.): Proceedings of the Workshop on Linguistic Theory and Grammar
Implementation. ESSLLI-2000, Birmingham, UK.
Gazdar, Gerald und Chris Mellish (1990): Natural
language processing in PROLOG: an introduction to computational linguistics.
Wokingham: Addison-Wesley.
Götz, Thilo und Detmar Meurers (1997): Interleaving
Universal Principles And Relational Constraints over Typed Feature Logic. In: Proceedings
of the 35th Annual Meeting of the ACL and 8th Conference of the EACL.
Madrid, Spain. 1997.
Götz, Thilo und Detmar Meurers (1997): The ConTroll
System as Large Grammar Development Platform. In: Proceedings of the Workshop
”Computational Environments for Grammar Development and Linguistic Engineering
(ENVGRAM)'' held in conjunction with the 35th Annual Meeting of the ACL and 8th
Conference of the EACL. Madrid, Spain. 1997.
Götz, Thilo und Detmar Meurers (1999): The importance
of being lazy - Using lazy evaluation to process queries to HPSG grammars. In:
Gert Webelhuth, Jean-Pierre Koenig und Andreas Kathol (Hg.): Lexical and
Constructional Aspects of Linguistic Explanation, CSLI Publications.
Götz, T. und G. Penn (1997): A Proposed Linear Specification Language. Arbeitspapier des Sonderforschungsbereichs
340, Nr. 134.
Hinrichs,
Erhard W. (1999): Welchen Beitrag kann die Linguistik zu technologische
Innovationen leisten? In: F. Meyer-Krahmer, S. Lange (Hg): Geisteswissenschaften
und Innovation. Heidelberg 1999, S. 187--196.
Meurers, Detmar und Guido Minnen (1997): A
Computational Treatment of Lexical Rules in HPSG as Covariation in Lexical
Entries. Computational Linguistics, 23 (4). pp. 543--568.
Meurers, Detmar und Guido Minnen (1999): Off-line
Constraint Propagation for Efficient HPSG Processing. In: Gert Webelhuth,
Jean-Pierre Koenig und Andreas Kathol (Hg.): Lexical and Constructional
Aspects of Linguistic Explanation. CSLI Publications.
Penn, G. (1999):
Tractability and Structural Closures in Attribute Logic Type Signatures.
Arbeitspapier
des Sonderforschungsbereichs 340, Nr. 135.
Penn, G. (1999): An Optimized Prolog Encoding of Typed
Feature Structures. Proceedings of
the 16th International Conference on Logic Programming (ICLP-99), Las
Cruces, New Mexico.
Penn, G. (1999): A Quasi-Ring Construction for
Compiling Attributed Type Signatures. Proceedings
of the 6th Meeting on the Mathematics of Language (MOL-6), Orlando,
Florida.
Penn, G. (1999): A Parsing Algorithm to Reduce Copying
in Prolog. Arbeitspapier
des Sonderforschungsbereichs 340, Nr. 137.
Penn, G. (1999): An Optimised Prolog Encoding of Typed
Feature Structures. Arbeitspapier des
Sonderforschungsbereichs 340, Nr. 138.
Penn, G. (1999): A Quasi-Ring Construction for
Compiling Attributed Type Signatures. Arbeitspapier des
Sonderforschungsbereichs 340, Nr. 141.
Penn, G. (2000): The Algebraic Structure of Attributed
Type Signatures. Doctoral Dissertation, Carnegie Mellon University School of
Computer Science.
Penn, G. (2000): The Algebraic Structure of Transitive
Closure and its Application to Attributed Type Signatures. To appear in Grammars 3, 2-3.
Penn, G. (2000): Applying Constraint Handling Rules to
HPSG. Proceedings of the First
International Conference on Computational Logic (CL2000), Workshop on
Rule-Based Constraint Reasoning and Programming, London, UK.
Penn, G.,
Hg. (2000):
Applying Constraint Handling Rules to HPSG. Some Aspects of Natural
Language Processing and Constraint Programming, F. Morawietz ed. Arbeitspapier des Sonderforschungsbereichs 340.
Penn, G. und B. Carpenter (1999): ALE for Speech: a
Translation Prototype. Proceedings
of the 6th Conference on Speech Communication and Technology (EUROSPEECH-99),
Budapest, Hungary, pp. 947--950.
Penn, G. und O. Popescu (1997): Head-Driven Generation
and Indexing in ALE. Proceedings of
the 35th Annual Meeting of the Association for Computational Linguistics,
Workshop on Computational Environments for Grammar Development and Linguistic
Engineering (ENVGRAM), Madrid, Spain.
Penn, G. und K. Steinicke (1999): Compiling
Feature-based Constraints with Complex Antecedents. Arbeitspapier
des Sonderforschungsbereichs 340, Nr. 136.
Pollard, Carl und Ivan Sag (1994): Head-Driven Phrase
Structure Grammar. University of Chicago Press.
Richter,
Frank (1999): RSRL for HPSG. In: Valia Kordoni (Hg.): Tübingen Studies in
Head-Driven Phrase Structure Grammar. Arbeitspapiere des SFB 340, Nr. 132,
Volume 1. Universität Tübingen. pp. 74-115.
Richter, Frank (2000): A Mathematical Formalism for
Linguistic Theories with an Application in Head-Driven Phrase Structure
Grammar. Dissertation.
Eberhard-Karls Universität Tübingen.
Richter, Frank und Manfred Sailer (1999): LF
Conditions on Expressions of Ty2: An HPSG Analysis of Negative Concord in
Polish. In: Robert D. Borsley, Adam Przepiórkowski (Hg.): Slavic in HPSG.
CSLI Publications. pp. 247-282.
Richter, Frank und Manfred Sailer (1999):
Underspecified Semantics in HPSG In: Harry Bunt, Reinhard Muskens (Hg.): Computing
Meaning. Studies in Linguistics and Philosophy. Kluwer Academic Publishers.
pp. 95-112.
Richter, Frank und Manfred Sailer (2001): On the left
periphery of German finite sentences. Erscheint in: Detmar Meurers, Tibor Kiss
(Hg.): Constraint-based approaches to Germanic syntax. CSLI
Publications.
Richter, Frank, Manfred Sailer und Gerald Penn (1999):
A Formal Interpretation of Relations and Quantification in HPSG. In: Gosse
Bouma, Erhard Hinrichs, Geert-Jan M. Kruijff und Richard T. Oehrle (Hg): Constraints
and Resources in Natural Language Syntax and Semantics. CSLI Publications. pp. 281-298.
Suhre, O. (1999): Computational Aspects of a Grammar
Formalism for Languages with Freer Word order.
Diplomarbeit
(MSc), Universität Tübingen.