Freie Universität Berlin                                                                                                                                   
Fachbereich Mathematik und Informatik
Institut für Informatik

 AG Datenbanken / Informationssysteme

Statistische Verfahren der Verarbeitung von Texten

S 19566         SS 2005             

Dozent: Prof. Dr. H. Schweppe, Christian Siefkes, Peter Siniakov


Das Seminar wurde als Blockveranstaltung am Freitag/Samstag, dem 17./18. Juni im K40 (Multimediaraum) durchgeführt.

Die fertigen Ausarbeitungen sind jetzt online zugänglich, allerdings ist der Zugriff nur von der FU-Informatik aus möglich.


Zielgruppe

Die Veranstaltung ist gedacht für Studierende der Informatikstudiengänge im Hauptstudium. Linguistische Kenntnisse sind von Vorteil, jedoch keine Voraussetzung. Kenntnisse in Statistik und/oder künstlicher Intelligenz sind nützlich aber nicht zwingend erforderlich.

Im Anschluss an das Seminar können Studien- und Diplomarbeiten vergeben werden.

Scheinkriterien

Themen 

Kursiv gedruckte Literaturangaben bieten ergänzende Hintergrundinformationen oder stellen Alternativansätze vor; vorrangig sind die anderen Quellen zu verwenden. In Klammern wird der Name des Bearbeiters eingetragen.

Information Retrieval (D. Graf): Ausarbeitung (Word-Format)

Preprocessing & Feature Selection (S. Weinmann)

Textklassifikation (P. Fiedler): Ausarbeitung (PDF-Format)

Hier soll nach Rücksprache mit den Veranstaltern nur ein Klassifikationsverfahren genauer dargestellt werden, z.B. Decision Rules oder Winnow (Linear Scoring).

Parsing (H. Bunjes): Ausarbeitung (PDF-Format)

Informationsextraktion mittels statistischer Verfahren (J. Lüning): Ausarbeitung (PDF-Format)

Wrapper Induction (M. Nachtigall): Ausarbeitung (Word-Format)

Disambiguierung von Wortbedeutungen (Word Sense Disambiguation) (F. Rauch)

Literatur

Bücher (im Handapparat)

Wissenschaftliche Artikel (verlinkt)

 

 

 

 

Zielgruppe

Scheinkriterien

Themen

Literatur