Einleitung

Ziel der Arbeit ist die Programmierung der Webapplikation "Components of Romance Syntax – O – Matic (CoRS-O-Mat)", auf deren Grundlage eine rechnergestützte Weiterführung des von der Deutschen Forschungsgemeinschaft (DFG) geförderten Projekts "Components of Romance Syntax (Bausteine romanischer Syntax)" ermöglicht werden soll.

Im folgenden Abschnitt wird die Zielsetzung des Forschungsprojekts CoRS kurz zusammengefasst und das methodische Vorgehen an einem Beispiel erläutert. Auf Details der Analyse und Ergebnisse wird an dieser Stelle nicht weiter eingegangen. Der Bedarf der Webapplikation leitet sich vor allem aus den nicht erreichten Zielen und methodischen Defiziten ab, die hier besonders hervorgehoben werden.

Im Abschnitt Problemstellung werden die methodisch-technischen Defizite konkretisiert und die Anforderungen formuliert.

Der letzte Abschnitt skizziert die geplante Umsetzung der Applikation.

CoRS - Projektbeschreibung

Components of Romance Syntax (Bausteine romanischer Syntax) - Übereinzelsprachlich gültige Formalisierung grundlegender syntaktischer Eigenschaften romanischer Sprachen im Rahmen des minimalistischen Programms. Projektleitung durch Prof. Dr. Eva-Maria Remberger, Universität Wien und Prof. Dr. Guido Mensching, Univer­sität Göttingen

Ziel des Projekts ist eine umfassende und formal homogene syntaktische Analyse der fünf großen romanischen Sprachen (Standardvarietäten des Französisch, Italienisch, Portugiesisch, Rumänisch, Spanisch). Die Analyse und Formalisierung ist im Rahmen des Minimalist Program (MP, vgl. Chomsky 1995) besonders in seiner jüngsten Entwicklung (vgl. Chomsky 2000ff.) umgesetzt worden. Einzelsprachliche Gemeinsamkeiten und Unterschiede sollen mit Hilfe weniger durch Merkmalskomposition und Schnittstellenbedingungen modellierter Parameter und auf der Grundlage eines generalisierten dynamischen Ableitungsmechanismus beschreibungsadäquat erfasst und erklärungsadäquat analysiert werden. Entstehen soll dabei eine synchrone Grammatik der Syntax der romanischen Sprachen. Zum Beispiel das Wortstellungsmuster V erb S ubjekt O bjekt ist bei einer neutralen Lesart im Italienischen und Portugiesischen nicht aktzeptabel, jedoch wenn das Objekt und das Subjekt fokussiert sind. Im Spanischen und Rumänischen ist VSO mit beiden Lesarten korrekt. Im Französischen ist diese Wortstellung mit keiner Lesart akzeptabel und aus rein syntaktischen Gründen ungrammatisch.

Eine Analyse musste daher nicht nur morpho-syntaktische Eigenschaften, sondern auch Lesarten (informationsstrukturelle Eigenschaften) miteinbeziehen. Ergebnisse des Projekts sind in Giurgea & Remberger (Giurgea, Ion & Eva-Maria Remberger (2012a): "Zur informationsstrukturellen Konfiguration und Variation postverbaler Subjekte in den romanischen Null-Subjekt-Sprachen." In: Zeitschrift für Sprachwissenschaft 31/1, 43–99.) und Mensching & Weingart (Mensching, Guido & Anja Weingart (im Druck): “The Null Subject Parameter and the lexicon in minimalist syntax”. In: Olga Fernandez, Amaya Mendikotxea, Luis Eguren (Hrgs.): Rethinking Parameters. Oxford University Press.) veröffentlicht.

Die Ziele des Projekts wurden nur teilweise oder unzureichend erreicht. Die erarbeiteten Merkmalskompositionen und deren Zuordnung zu funktionalen Kategorien ergab Grammatiken, die übergenerieren, die also auch ungrammatische Strukturen erzeugen. Das zentrale Kriterium einer explanatorischen Grammatik, ungrammatische Strukturen auszuschließen, wurde damit nicht erreicht. Eine systematische Analyse aller syntaktischen Teilbereiche war aufgrund der technischen Umsetzung der Datensammlung nicht möglich.

CoRS - Problemstellung

Es wurde eine Datentabelle in Microsoft Word angelegt. Das gewählte Datenformat erlaubt kein gleichzeitiges Bearbeiten der Daten, obwohl das Projekt CoRS ein kollaboratives Forschungsprojekt ist, an dem Mitarbeiter an internationalen Standorten verteilt arbeiteten. Die ca. 4000 gesammelten Sprachdatensätze sind nicht mehr effizient auswertbar und in ihrer Struktur nicht einheitlich aufgenommen worden. Aus diesen Gründen konnten nur Einzelphänomene auf der Basis eines Bruchteils der erhobenen Daten untersucht werden. Umfassendere Analysen scheiterten am gewählten Datenformat, das keine gezielten Abfragen zulässt.

Die Webapplikation CoRS-O-Mat soll verwendet werden, um die Sprachdaten einheitlich zu annotieren und zu strukturieren und zusammen mit den dazugehörigen bibliographischen Angaben zu verwalten. Zudem sollen komplexe und teilautomatisierte Auswertungen ermöglicht werden.

Die Webapplikation soll dem Anwender folgende Möglichkeiten bieten:

CoRS-O-Mat - geplante Umsetzung

Die Umsetzung der Webapplikation CoRS-O-Mat erfolgt als agiler und iterativer Entwicklungsprozess nach der Entwicklungsmethode Scrum. Die formulierten User Stories landen als Anforderungen im Scrum Product Backlog. Die zur Verfügung stehende Entwicklungszeit wird in Abschnitte (Meilensteine) unterteilt. Wird ein Meilenstein erreicht, gilt der Abschnitt als abgeschlossen und es kann eine funktionierende Programmversion mit neuer Funktionalität ausgeliefert werden.

Die Webapplikation wird so konstruiert, dass sie auch für andere Forschungsprojekte der Geisteswissenschaften wiederverwendet werden kann. Das wird erreicht durch eine gekapselte und modulare Softwarearchitektur. Durch die Orientierung an modernen Softwareentwurfsmustern sowie der Anfertigung einer verständlichen Dokumentation soll sichergestellt werden, dass der Aufwand für die Anpassung an die spezifischen Anforderungen anderer Forschungsprojekte der Geisteswissenschaften möglichst gering ausfällt.

Das Systementwicklungsprojekt CoRS-O-Mat wird produktbasiert geplant. Diese Planungsmethode orientiert sich primär nicht an den durchzuführenden Aktivitäten sondern an den zu liefernden Produkten. Als Projektdurchführungsstrategie wird "Inkrementelle Entwicklung" in Kombination mit der Entwicklungsmethode Scrum verwendet. Zur Qualitätssicherung werden die Methoden "Akzeptanztest getriebene Entwicklung" und "Kontinuierliche Lieferung" eingesetzt.

Die Webapplikation CoRS-O-Mat wird auf Basis des Softwarekomponentensystems Java EE, seiner Referenzimplementierung GlassFish 4 sowie dem Datenbankmanagementsystem MySQL realisiert. Den Anwendern wird über das Internet eine Benutzeroberfläche (HTML, CSS, JS) zur Verfügung gestellt, die in einem Webbrowser präsentiert wird. Die Software und deren Dokumentationen sollen unter die freie Lizenz European Union Public Licence (EUPL) gestellt und in einem öffentlichen Repository bei SourceForge publiziert werden.