Freie Universität Berlin                                                                                                                                    AG-DB Logo
Fachbereich Mathematik und Informatik
Institut für Informatik

 AG Datenbanken / Informationssysteme

DBS Projektseminar WS05/06
Aktuelle Trends der Datenhaltung

Angelehnt an aktuelle Forschungsprojekte der AG-DB werden kleine Projekte aus den Themenbereichen "Datenhaltung in mobilen Netzen" und "Verarbeitung natürlicher Sprache" von kleinen Gruppen (max. 2 Teilnehmer) bearbeitet. Die Projekte werden jeweils von einem Projektmitarbeiter betreut und umfassen sowohl Entwurfs- als auch Implementierungsarbeiten. Über den Fortschritt des Projektes soll in regelmäßigen Abständen in Form von Kurzvorträgen berichtet werden.

Die Projektseminare können auch der Vorbereitung von Diplomarbeiten bei der AG-DB dienen. Das Projektseminar lässt sich mit 4 SWS bzw. 8 ECTS Credits anrechnen. Wahlweise kann ein Seminarschein oder Projektschein erworben werden.

Bei Interesse an einem der vorgeschlagenen Themen bitte bei dem jeweiligen Betreuer oder den Organisatoren melden.


Organisation: Joos-Hendrik Böse und Prof. H. Schweppe

Termine

Die Projekte werden in kleinen Gruppen bearbeitet, welche flexibel Termin mit ihrem Betreuer vereinbaren. Es gibt monatlich einen Termin an dem die einzelnen Projekte ihre Ergebnisse präsentieren. Die Projekte können auch während des Semesters oder in den Semesterferien bearbeitet werden, der Starttermin ist frei verhandelbar mit dem jeweiligen Betreuer. Die folgenden Termine sind Pflicht für alle Teilnehmer:

Termin
Zeit und Ort
Vorstellung der Themen
17.10.2005 um 16:00 SR006
25.10.2005 um 18:00 SR046
1. Präsentationstermin
16.11.2005 um 16:00 SR051
2. Präsentationstermin
18.01.2006 um 16:00 SR051
3. Präsentationstermin
15.2.2006 um 18:00 SR051
Abgabe und Abschlußpräsentation
12.4.2006 um 18:00 R135

Präsentationen

Zu den Gesamttreffen wird von jeder Projektgruppe ein kleiner Vortrag über den aktuellen Status des Projektes erwartet. Zur ersten Präsentation gehört auch eine kleine Einführung in das behandelte Problemfeld und den Kontext, in den das Projekt eingebettet ist. Die Präsentation kann in Deutsch oder Englisch gehalten werden.

Abgabe und Abschlußpräsentation

Die Projektdokumentation (Ausführliche Dokumentation + 8 Seiten Kurzfassung) muß spätestens am 31.3.2006 beim Betreuer des jeweiligen Projektes abgegeben werden.


Themen

  1. Entwicklung eines Deployment Prozesses für MANET Emulationen
  2. Bereitstellung von Kontextinformationen mit Hilfe von Moving Object Databases
  3. Experimentelle Untersuchung gerichteter und ungerichteter Verteilungsstrategien in mobilen ad-hoc Netzwerken
  4. Entwicklung einer persistenten Message Queue für mobile ad-hoc Netze
  5. Entwicklung einer Anwendung zum Tauschen von Übungsaufgaben auf Basis der SLS Middleware
  6. Spatio-Temporal Datamining für Location-Based Services

Beschreibungen

Entwicklung eines Deployment Prozesses für MANET Emulationen

Das direkte Testen von Softwarekomponenten für MANETs im Rahmen eines Continuous Integration Ansatzes nicht möglich, da hierfür die Software auf echte Geräte deployed werden müsste, die dann nach definierten Bewegungsmustern bewegt werden müssten. Da im Rahmen des Continuous Integration Ansatzes nach jeder Änderung alle Komponenten und deren Zusammenspiel getestet werden, wäre ein Test auf echten Geräten zu aufwendig. Eine alternative Testmethode ist die Verwendung eines Xen basierten Emulators, dieser emuliert mobile Knoten auf stationären Rechnern und kontrolliert die Kommunikation zwischen diesen mit Hilfe eines definierten Bewegungsmodells.
In diesem Projekt soll ein Prozess zum automatischen Testen von Komponenten für MANETs entwickelt werden. Um das Testen und Deployen in ein vorhandenes Buildsystem einbetten zu können, soll der Deployment und Testprozess als Maven Gloals definiert werden. Das Buildsystem sowie eine Installation des Emulators ist bereits vorhanden. Vorraussetzung für dieses Projekt sind sehr gute Java Kenntnisse und möglichst erste Erfahrungen mit Maven.

Bereitstellung von Kontextinformationen mit Hilfe von Moving Object Databases

Im Rahmen des CoCoDa Projektes wird eine Middleware Suite entwickelt, die Replikation und Transaktionen in mobilen ad hoc Netzwerken unterstützt.  Verbindungen zwischen Interaktionspartnern sind konstant instabil.  Daher werden Kontextinformationen einzelner Knoten (z.B. Position, Bewegungsrichtung, Restlaufzeit des Akkus, etc.) der aktuellen Nachbarn gesammelt.  Diese Informationen werden ausgewertet, um Interaktionstrategien an den aktuellen Kontext anzupassen (z.B. Die Wahl eines Koordinators bei einer Transaktion mit n Teilnehmern, sollte der Knoten sein, der für alle am stabilsten zu erreichen ist).  Die Aktualität der Kontextinformationen beruht darauf, wie oft Positionsdaten ausgetauscht werden.  Um möglichst wenig Netzwerklast zu erzeugen und trotzdem eine hohe Aktualität der Daten zu erreichen, soll in diesem Projekt eine Moving Object Database (MOD) auf mobilen Knoten implementiert werden.  Diese bietet den Vorteil, dynamische Attribute, d.h. Attribute, die sich ohne explizite Updates ändern (z.B. Position), zu verwalten, sowie temporale Anfragen zu stellen.  Somit können ebenfalls kosteneffizient Anfragen über zukünftige Aufenhaltsorte von Knoten bearbeitet werden.

Experimentelle Untersuchung gerichteter und ungerichteter Verteilungsstrategien in mobilen ad-hoc Netzwerken

Ein ad-hoc-Netzwerk bezeichnet in der Informationstechnologie eine drahtlose Verbindung zwischen zwei oder mehreren mobilen Endgeräten, die ohne feste Infrastruktur auskommt.  Meist handelt es sich hierbei um kleine Geräte (z.B. PDA's, Smartphones), die sich über Bluetooth oder auch WLAN verbinden. In ad-hoc Netzen kommt es auf Grund der beschränkten Ressourcen dieser kleinen Geräte, instabiler drahtloser Übertragung und der Bewegung der Knoten im Netz, häufig zu Ausfällen von Knoten.  Eine Möglichkeit, trotz der häufigen Ausfälle der Geräte, Verfügbarkeit von Daten zu garantieren, ist, Kopien dieser Daten (Informations-Items) im Netz zu verteilen.  Hierbei muss abgeschätzt werden, wie viele Kopien verteilt werden.  Werden zu wenige Kopien verteilt, so besteht die Gefahr, dass alle Knoten, die eine solche Kopie tragen, zu einem späteren Zeitpunkt ebenfalls nicht im Netz zur Verfügung stehen.  Werden zu viele Knoten im Netz verteilt, so werden die Ressourcen aller beteiligten Geräte zu stark strapaziert.  Ziel dieser Arbeit ist es daher, mit möglichst geringem Aufwand (Netzwerk- und Speicherkosten) die höchste Wahrscheinlichkeit zu erreichen.  Um dies zu erreichen sollen kontext-abhängige Informationen der beteiligten Knoten (im Besonderen Ausfallwahrscheinlichkeit) zusätzlich in Betracht gezogen werden.  Folgende Strategien stehen dabei zur Verfügung:
  1. Bei der gerichteten Verteilung werden die Ausfallwahrscheinlichkeiten der benachbarten Knoten betrachtet, so dass eine Menge von ihnen ausgewählt werden kann, die das Log speichern, um damit einen bestimmten Wahrscheinlichkeitsschwellwert zu überschreiten.  Ein Knoten, der ein Log sucht, muss dann unter Kenntnis der Identifiern dieser Knoten versuchen, das Informations-Item wieder zu finden.
  2. Die ungerichtete Verteilung zielt darauf ab, das Log zufällig im ganzen Netz zu verteilen, so dass ein bestimmter Verteilungsgrad (Anzahl der Knoten mit Log / Gesamtanzahl Knoten) erreicht wird.  Eine Verteilungsstrategie, um das zu erreichen, könnte so aussehen, dass das gesamte Netz geflutet wird, aber die Knoten das Log nur mit einer bestimmten Wahrscheinlichkeit speichern.  Die Wahrscheinlichkeit, dass das Log wieder gefunden wird, hängt in diesem Fall von der Anzahl der Knoten, die danach gefragt werden ab.
Ziel dieser Arbeit ist es, eine Bewertung der gerichteten, ungerichteten Verteilung und einer Kombination beider Strategien zu erstellen bezüglich Kosten, in Form von Datenlast und Speicherkosten, und Nutzen, der durch die Wahrscheinlichkeit ausgedrückt wird.  Als Basis für diese Bewertung soll eine Simulation im Netzwerksimulator ns2 durchgeführt werden.

Entwicklung einer persistenten Message Queue für mobile ad-hoc Netze

Nachrichten orientierte Middleware (Message Oriented Middleware (MOM)) unterstützt die Kommunikation zwischen verteilten Komponenten durch Nachrichtenvermittlung: Clients senden Nachrichten mit einem Serviceaufruf and zugehörigen Parametern an andere Komponenten durch das Netz. Empfänger führen den angeforderten Dienst aus und schicken asynchron eine Nachricht mit dem Ergebnis des Dienstes an den Sender zurück. Nachrichten orientierte Middleware ermöglicht eine Entkopplung von Client und Server, da der Client bereits in seinem Workflow weiterverfahren kann, sobald die Middleware seine Nachricht akzeptiert hat. Die eventuelle Antwort kann sich der Client zu einer beliebigen Zeit später abholen.
Die Kommunikationsmetapher von MOM passt relativ gut zu den Anforderungen in mobilen ad-hoc Netzen (MANETs), entsprechend soll in diesem Projekt eine persistente Nachrichten Queue für MANETs entwickelt werden. Da in MANETs nicht von einem zentralen Server ausgegangen werden kann, auf dem eine solche Message Queue persistent abgelegt werden kann, soll die Message Queue auf Basis eines verteilen  virtuellen Speichers entwickelt werden.

Entwicklung einer Anwendung zum Tauschen von Übungsaufgaben auf Basis der SLS Middleware

Auf Basis der im Rahmen des CoCoDa Projektes entwickelten SLS Middleware soll ein Prototyp für eine P2P Anwendung zum fairen Tauschen von Übungsaufgaben in einem MANET entwickelt werden. Die SLS Middleware soll dabei verwendet werden, um Verträge zwischen den Tauschpartnern zu sichern, die später  dazu verwendet werden, dass jeweils faire bzw. unfaire Verhalten eines Tauschpartners beweisen zu können.

Spatio-Temporal Datamining für Location-Based Services

Aufgrund der Fortschritte in der Positionsbestimmung von mobilen Geräten verfügen Betreiber von Mobilfunknetzen über große Mengen an gesammelten Positionsdaten, deren Analyse und Speicherung neue Herausforderungen bedeuten. Ziel dieses Projektes ist die Entwicklung von Spatio-Temporal Datamining Techniken um Bewegunginformationen zu extrahieren, um diese Location-Based Services zur Verfügung zu stellen.

Unter den verschiedenen positionsbewussten Infrastrukturen sind Mobilfunknetze die interessantesten Plattformen für Location-Based Services, da deren Verfügbarkeit im Vergleich zu MANETs sehr hoch ist, größere Flächen abgedeckt sind und eine große Zahl von Nutzern erreicht wird. Dieses Projekt wird daher einen Datensatz eines Mobilfunkbetreibers verwenden, um darauf Spatio-Temporale Datamining Techniken zu entwickeln, um Bewegungsmuster zu bestimmen und über einen längeren Zeitraum vorherzusagen. Diese Techniken können von Mobilfunkbetreibern sowie von Anbietern von Location-Based Services verwendet werden.




Hauptseite