Webbasierte Informationssysteme



Hier gibt es Links auf Aufgabenzettel, zu lesende Literatur, VL-Skripten und Vortragsunterlagen.
 VL Unterlagen

Inhaltsuebersicht zur VL

Die ersten Folien:

1. Grundlagen und Einfuehrung (ppt)

2. Grundlagen des Information Retrieval (ppt)

3. Implementieriungstechniken  (ppt)

4. Weitere Retrieval-Modelle (ppt)

5. Einführung und Literatur Retrieval auf Bildern (ppt, ps)

6. Interoperabilitaet im WWW mit XML 
   6.1 XML Einfuehrung (ppt, gzip ppt, zip ppt)
   6.2 XML Anfragesprachen (ppt, gzip ppt, zip ppt)
   6.3 RDF (ppt, ps)
   6.4 Semistrukturierte Daten (ppt)

7. Event Notification / Aktive Datenbanken (ppt)

8. Replikation und Caching (ppt)



 Übungszettel und weitere Aufgaben
1. Woche Bush: "As we may think" lesen bis 25.10.2000
2. Woche Blatt 1 bis 1.11.2000
3. Woche Blatt 2 bis 8.11.2000

 "Brin and Page: "The anatomy of a large scale hypertextual Web Search Engine" (Google) bis 8.11.2000

Projektaufgabe: Architekturüberlegungen zur Searchengine

4. Woche Blatt 3 bis 15.11.2000

Projektaufgabe: Crawler implementieren, Indexierer vorbereiten

5. Woche Blatt 4 bis 22.11.2000
6. Woche Blatt 5 bis 29.11.2000

Projektaufgabe: Abschliessen der Crwaler/Paerser/Indexierer-Komponente, Erstellen des Index

7. Woche Blatt 6 bis 06.12.2000

Projektaufgabe: Implementierung Anfrage-Parser, Suche, GUI

8. Woche Blatt 7 bis 13.12.2000

Projektaufgabe: Ende der Woche sollte die Implementierung abgeschlossen sein.

9. Woche Blatt 8 bis 20.12.2000

Projektaufgabe: Testszenarien sind zu entwickeln und vorzustellen

10. Woche Blatt 9 bis 17.1.2001

Projektaufgabe: Testszenarien, Tests, Vortrag vorbereiten

11. Woche kein Uebungsblatt

Projektaufgabe: Vortraege zum Projektabschluss am 24.1.2001

12. Woche Blatt 10 bis 7.2.2001

Achtung, Überarbeitete Projektaufgabe und Zusatzinformationen auf dem Blatt,
XML-Texte unter SigmodRecord.tar.gz

13. Woche Blatt 11 bis 7.2.2001
14. Woche Klausurvorbereitung zum 14.2.2001
15. Woche Klausur am 14.2.2001, 8:30-11:30


 Zusatzliteratur zu Themen der VL
Zipfs Law: Zipf, George Kingsley: Human Behavior and the Principle of Least Effort (Addison-Wesley, 1949). 


  • Lee Breslau et.al: On the Implications of Zipf's Law for Web Caching
  • schöne Übersichtsseite mit vielen Links zu Anwendungsfeldern von Zipfs Law, Ökologie, Informatik, Web-Statistiken, Biologie,..... 
  • Elias Gamma Code  Elias, P.: Universal Codeword Sets and Representations of the Integers. IEEE Trans. Inform. Theory 21, 2 (Mar.), 194-203. 1975


  • Bell,Moffat and Witten: Compressing the Digital Library 
  • Optimaler Code Shannons klassischer Artikel von 1948, der die Grundlagen der Informationstheorie gelegt hat: 
    C.E. Shannon: A Mathematical Theory of Communication , Bell Systems Technical Journal 27, 379-423, 623-656; 1948
    Suffixarrays Manber & Myers: Suffix-Arrays - A new Method for On-Line Sting Searches , SIAM Journal on Computing, (October 1993), pp. 935-948. An earlier version appeared in the first Annual ACM-SIAM Symposium on Discrete Algorithms, San Francisco (January 1990), pp. 319-327. 

    Bitte denkt daran, Eure Vortragsunterlagen in elektronischer Form abzugeben, sodass sie hier mit verlinkt werden können. 
    25.10.2000, Vortrag von ...
    Folien: Seite 1|Seite 2|Seite 3|Seite 4|Seite 5|Seite 6|
    Einführung HTTP
    1.11.2000, Vortrag von ...,
    Folien: zip-ppt
    8.11.2000, Vortrag von Valerie Bures
    Brin, S. and Lawrence P., The anatomy of a large-scale Web search engine. In Conference Proceedings of the 7th International WWW Conference, 101-117, 1999. 21 of 21 
    Folien: zip-ppt
    Java und Netzanbindung
    8.11.2000, Vortrag von Alexander Tobis
    Folien: zip-ppt
    Lexicographische Vorverarbeitung
    22.11.2000, Vortrag von Olaf Licht
    Folien: doc, zip-doc
    Microsoft .Net
    Vortrag von Thomas ...
    Folien: ppt
    Vortrag von Kilian Lenz
    Folien: ppt
    Oracle Interaktion mit Applicationen ueber Trigger
    Vortrag von Mariusz Kukulski und Sven Bittner
    Folien: ppt
    Oracle Intermedia
    Vortrag von David und Andreas
    Folien: ppt