Webbasierte Informationssysteme

 

Projekt 1: Suchmaschine



 

Allgemeine Aufgabenstellung

Im Rahmen der Veranstaltung soll als erstes Projekt eine Internet-fähige Volltextsuchmaschine für Musikfiles und Videos entwickelt, implementiert und dokumentiert werden.

Als Startpunkte werden eine Reihe von geeigneten URL's angenommen. Die Suchmaschine ist fuer bestimmte Web-Dokumente (Video und Musik in entsprechenden Speicherformaten ) spezialisiert. Es soll einerseits ermoeglicht werden, einzelne Stuecke nach ihrem Titel oder dessen Teilen zu suchen (z.B. finde "Money, money, money" von ABBA). Andererseits sollen die Dateien nach bestimmten Themen aufgefunden werden koennen (finde Musik oder Videos zum Thema "Hochzeit"). Hierbei muessen insbesondere die verweisenden Internetseiten analysiert werden, um Art und Verwendung der gesuchten Dokumente zu bestimmmen. Die Suchmaschine soll alle HTML, XML und Ascii-Texte indizieren, die ueber die Seiten der vorgegebenen URL zugegriffen werden kann und die auf Dokumente des gewuenschten Inhalts und Formates zeigen (Link). XML-Daten sollen, soweit zugaenglich, in einem ersten Schritt in mark-up-freie Dokumente uebersetzt werden und als solche indexiert werden. Im weiteren Verlauf der Veranstaltung ist eine Ausnutzung der XML-Struktur fuer die Suche denkbar.

Die Darstellung der Ergebnisse einer Anfrage soll ein Ranking der gefundenen Dokumente beinhalten. Es soll den BenutzerInnen ermoeglicht werden, die gesuchten Dokumente (ppt,mp3) direkt anhand eines aussagekraeftigen Kommentares zu identifizieren und zu laden, bzw. die verweisende Seite anzuwaehlen.

Die Entwicklung und Realisierung der Suchmaschine erfolgt schrittweise und in Abstimmung mit der Vorlesung und den Vorträgen.

Die Dokumentation erfolgt einerseits im Java-Quellcode und wird mit Javadoc präsentiert. Gleichzeitig soll der Entwurf und die Entwicklung des Projektes in Form einer Entwickluungsdokumentation im Web festgehalten werden. Die Suchmaschinen sollen bezueglich ihrer Leistungsfaehigkeit getestet werden. Dazu sind geeignete Kriterien zu entwickeln und Tests durchzufuehren. Die Ergebnisse der Tests sind zu dokumentieren und zu bewerten.

Organisation

Das Projekt wird von zwei Projekt-Gruppen umgesetzt werden, sodass zwei vergleichbare Imlementierungen fuer Vergleiche vorliegen. Jede Projekt-Gruppe hat einen Projektleiter als Ansprechpartner und fuer allgemeine Oranisationsangelegenheiten (Heiko Kahmann und Jan Kretzschmar). Die Projektgruppen wiederum setzen sich aus Arbeitsgruppen von 2-3 Studierenden zusammen (und benennt einen Ansprechpartner). Eine Arbeitsgruppe uebernimmt jeweils einen Teil der Implementierung des Gesamtsystems. Die Schnittstellen zwischen den Teilen muessen daher rechtzeitig und ausfuehrlich definiert werden. Java-Programmierkenntnisse und Datenbankkentnisse werden bei den TeilnehmerInnen des Kurses vorausgesetzt.