Freie Universität
Berlin
Fachbereich Mathematik und
Informatik
Institut für Informatik
AG
Datenbanken / Informationssysteme
DBS Projektseminar WS05/06
Aktuelle Trends der Datenhaltung
Angelehnt an aktuelle Forschungsprojekte der AG-DB werden kleine
Projekte
aus den Themenbereichen "Datenhaltung in mobilen Netzen"
und "Verarbeitung natürlicher Sprache" von kleinen
Gruppen (max. 2 Teilnehmer) bearbeitet. Die Projekte werden jeweils
von einem Projektmitarbeiter betreut und umfassen sowohl Entwurfs-
als auch Implementierungsarbeiten. Über den Fortschritt des
Projektes
soll in regelmäßigen Abständen in Form von
Kurzvorträgen berichtet
werden.
Die Projektseminare können auch der Vorbereitung von
Diplomarbeiten
bei der AG-DB dienen. Das Projektseminar lässt sich mit 4 SWS bzw.
8 ECTS Credits anrechnen. Wahlweise kann ein Seminarschein oder
Projektschein erworben werden.
Bei Interesse an einem der vorgeschlagenen Themen bitte bei dem
jeweiligen Betreuer oder den Organisatoren melden.
Organisation: Joos-Hendrik Böse und Prof. H.
Schweppe
Termine
Die Projekte werden in kleinen
Gruppen bearbeitet, welche flexibel Termin mit ihrem Betreuer
vereinbaren. Es gibt monatlich einen Termin an dem die einzelnen
Projekte ihre Ergebnisse präsentieren. Die Projekte können
auch während des Semesters oder in den Semesterferien bearbeitet
werden, der Starttermin ist frei verhandelbar mit dem jeweiligen
Betreuer. Die folgenden Termine sind Pflicht für alle Teilnehmer:
Termin
|
Zeit und Ort
|
Vorstellung
der Themen
|
17.10.2005
um 16:00 SR006
25.10.2005 um 18:00 SR046
|
1.
Präsentationstermin
|
16.11.2005
um 16:00 SR051
|
2.
Präsentationstermin
|
18.01.2006
um 16:00 SR051
|
3.
Präsentationstermin
|
15.2.2006 um
18:00 SR051
|
Abgabe und
Abschlußpräsentation
|
12.4.2006 um
18:00 R135
|
Präsentationen
Zu den Gesamttreffen wird von jeder Projektgruppe ein kleiner Vortrag
über den aktuellen Status des Projektes erwartet. Zur ersten
Präsentation gehört auch eine kleine Einführung in das
behandelte Problemfeld und den Kontext, in den das Projekt eingebettet
ist. Die Präsentation kann in Deutsch oder Englisch gehalten
werden.
Abgabe und Abschlußpräsentation
Die Projektdokumentation (Ausführliche Dokumentation + 8 Seiten
Kurzfassung) muß spätestens am 31.3.2006
beim Betreuer des jeweiligen Projektes abgegeben werden.
- Abschlußpräsentation aller Projekte ist am 12.4.2006 ab
18:00 im Raum135
Themen
- Entwicklung eines
Deployment Prozesses für MANET Emulationen
- Bereitstellung von
Kontextinformationen mit Hilfe von Moving Object Databases
- Experimentelle
Untersuchung gerichteter und ungerichteter
Verteilungsstrategien in mobilen ad-hoc Netzwerken
- Entwicklung einer
persistenten Message Queue für mobile ad-hoc
Netze
- Entwicklung einer
Anwendung zum Tauschen von Übungsaufgaben
auf Basis der SLS Middleware
- Spatio-Temporal
Datamining für Location-Based Services
Beschreibungen
Entwicklung
eines Deployment Prozesses für MANET Emulationen
Das direkte Testen von Softwarekomponenten für MANETs im Rahmen
eines Continuous Integration Ansatzes nicht möglich, da
hierfür die Software auf echte Geräte deployed werden
müsste, die dann nach definierten Bewegungsmustern bewegt werden
müssten. Da im Rahmen des Continuous Integration Ansatzes nach
jeder Änderung alle Komponenten und deren Zusammenspiel getestet
werden, wäre ein Test auf echten Geräten zu aufwendig. Eine
alternative Testmethode ist die Verwendung eines Xen basierten
Emulators, dieser emuliert mobile Knoten auf stationären Rechnern
und kontrolliert die Kommunikation zwischen diesen mit Hilfe eines
definierten Bewegungsmodells.
In diesem Projekt soll ein Prozess zum automatischen Testen von
Komponenten für MANETs entwickelt werden. Um das Testen und
Deployen in ein vorhandenes Buildsystem einbetten zu können, soll
der Deployment und Testprozess als Maven
Gloals definiert werden. Das Buildsystem sowie eine Installation des
Emulators ist bereits vorhanden. Vorraussetzung für dieses Projekt
sind sehr gute Java Kenntnisse und möglichst erste Erfahrungen mit
Maven.
- Betreuer: Joos-Hendrik Böse (boese[at]mi.fu-berlin.de)
- Vergeben an: Stefan Murawski
Bereitstellung
von Kontextinformationen mit Hilfe von Moving Object Databases
Im Rahmen des CoCoDa
Projektes wird eine Middleware Suite entwickelt, die Replikation
und Transaktionen in mobilen ad hoc Netzwerken unterstützt.
Verbindungen zwischen Interaktionspartnern sind konstant
instabil. Daher werden Kontextinformationen einzelner Knoten
(z.B. Position, Bewegungsrichtung, Restlaufzeit des Akkus, etc.) der
aktuellen Nachbarn gesammelt. Diese Informationen werden
ausgewertet, um Interaktionstrategien an den aktuellen Kontext
anzupassen (z.B. Die Wahl eines Koordinators bei einer Transaktion mit
n Teilnehmern, sollte der Knoten sein, der für alle am stabilsten
zu erreichen ist). Die Aktualität der Kontextinformationen
beruht darauf, wie oft Positionsdaten ausgetauscht werden. Um
möglichst wenig Netzwerklast zu erzeugen und trotzdem eine hohe
Aktualität der Daten zu erreichen, soll in diesem Projekt eine
Moving Object Database (MOD) auf mobilen Knoten implementiert
werden. Diese bietet den Vorteil, dynamische Attribute, d.h.
Attribute, die sich ohne explizite Updates ändern (z.B. Position),
zu verwalten, sowie temporale Anfragen zu stellen. Somit
können ebenfalls kosteneffizient Anfragen über
zukünftige Aufenhaltsorte von Knoten bearbeitet werden.
- Betreuer: Katharina Hahn (khahn[at]mi.fu-berlin.de)
Experimentelle
Untersuchung gerichteter und ungerichteter
Verteilungsstrategien in mobilen ad-hoc Netzwerken
Ein ad-hoc-Netzwerk bezeichnet in der Informationstechnologie eine
drahtlose Verbindung zwischen zwei oder mehreren mobilen
Endgeräten, die ohne feste Infrastruktur auskommt. Meist
handelt es sich hierbei um kleine Geräte (z.B. PDA's,
Smartphones), die sich über Bluetooth oder auch WLAN verbinden. In
ad-hoc Netzen kommt es auf Grund der beschränkten Ressourcen
dieser kleinen Geräte, instabiler drahtloser Übertragung und
der Bewegung der Knoten im Netz, häufig zu Ausfällen von
Knoten. Eine Möglichkeit, trotz der häufigen
Ausfälle der Geräte, Verfügbarkeit von Daten zu
garantieren, ist, Kopien dieser Daten (Informations-Items) im Netz zu
verteilen. Hierbei muss abgeschätzt werden, wie viele Kopien
verteilt werden. Werden zu wenige Kopien verteilt, so besteht die
Gefahr, dass alle Knoten, die eine solche Kopie tragen, zu einem
späteren Zeitpunkt ebenfalls nicht im Netz zur Verfügung
stehen. Werden zu viele Knoten im Netz verteilt, so werden die
Ressourcen aller beteiligten Geräte zu stark strapaziert.
Ziel dieser Arbeit ist es daher, mit möglichst geringem Aufwand
(Netzwerk- und Speicherkosten) die höchste Wahrscheinlichkeit zu
erreichen. Um dies zu erreichen sollen kontext-abhängige
Informationen der beteiligten Knoten (im Besonderen
Ausfallwahrscheinlichkeit) zusätzlich in Betracht gezogen
werden. Folgende Strategien stehen dabei zur Verfügung:
- Bei der gerichteten Verteilung werden die
Ausfallwahrscheinlichkeiten der benachbarten Knoten betrachtet, so dass
eine Menge von ihnen ausgewählt werden kann, die das Log
speichern, um damit einen bestimmten Wahrscheinlichkeitsschwellwert zu
überschreiten. Ein Knoten, der ein Log sucht, muss dann
unter Kenntnis der Identifiern dieser Knoten versuchen, das
Informations-Item wieder zu finden.
- Die ungerichtete Verteilung zielt darauf ab, das Log
zufällig im ganzen Netz zu verteilen, so dass ein bestimmter
Verteilungsgrad (Anzahl der Knoten mit Log / Gesamtanzahl Knoten)
erreicht wird. Eine Verteilungsstrategie, um das zu erreichen,
könnte so aussehen, dass das gesamte Netz geflutet wird, aber die
Knoten das Log nur mit einer bestimmten Wahrscheinlichkeit
speichern. Die Wahrscheinlichkeit, dass das Log wieder gefunden
wird, hängt in diesem Fall von der Anzahl der Knoten, die danach
gefragt werden ab.
Ziel dieser Arbeit ist es, eine Bewertung der gerichteten,
ungerichteten Verteilung und einer Kombination beider Strategien zu
erstellen bezüglich Kosten, in Form von Datenlast und
Speicherkosten, und Nutzen, der durch die Wahrscheinlichkeit
ausgedrückt wird. Als Basis für diese Bewertung soll
eine Simulation im Netzwerksimulator ns2 durchgeführt werden.
- Betreuer: Joos-Hendrik Böse und Katharina Hahn (boese |
khahn [at] mi.fu-berlin.de)
Entwicklung
einer persistenten Message Queue für mobile ad-hoc
Netze
Nachrichten orientierte Middleware (Message Oriented Middleware (MOM))
unterstützt die Kommunikation zwischen verteilten Komponenten
durch Nachrichtenvermittlung: Clients senden Nachrichten mit einem
Serviceaufruf and zugehörigen Parametern an andere Komponenten
durch das Netz. Empfänger führen den angeforderten Dienst aus
und schicken asynchron eine Nachricht mit dem Ergebnis des Dienstes an
den Sender zurück. Nachrichten orientierte Middleware
ermöglicht eine Entkopplung von Client und Server, da der Client
bereits in seinem Workflow weiterverfahren kann, sobald die Middleware
seine Nachricht akzeptiert hat. Die eventuelle Antwort kann sich der
Client zu einer beliebigen Zeit später abholen.
Die Kommunikationsmetapher von MOM passt relativ gut zu den
Anforderungen in mobilen ad-hoc Netzen (MANETs), entsprechend soll in
diesem Projekt eine persistente Nachrichten Queue für MANETs
entwickelt werden. Da in MANETs nicht von einem zentralen Server
ausgegangen werden kann, auf dem eine solche Message Queue persistent
abgelegt werden kann, soll die Message Queue auf Basis eines
verteilen virtuellen Speichers entwickelt werden.
- Betreuer: Joos-Hendrik Böse (boese[at]mi.fu-berlin.de)
- Vergeben an: Iavor Jelev
Entwicklung
einer Anwendung zum Tauschen von Übungsaufgaben
auf Basis der SLS Middleware
Auf Basis der im Rahmen des CoCoDa
Projektes entwickelten SLS Middleware soll ein Prototyp für
eine P2P Anwendung zum fairen Tauschen von Übungsaufgaben in einem
MANET entwickelt werden. Die SLS Middleware soll dabei verwendet
werden, um Verträge zwischen den Tauschpartnern zu sichern, die
später dazu verwendet werden, dass jeweils faire bzw.
unfaire Verhalten eines Tauschpartners beweisen zu können.
- Betreuer: Joos-Hendrik Böse, Katharina Hahn
(boese/khahn[at]mi.fu-berlin.de)
- Vergeben an: Karima Habassi und Elena Antonenko
Spatio-Temporal
Datamining für Location-Based Services
Aufgrund der Fortschritte in der Positionsbestimmung von mobilen
Geräten verfügen Betreiber von Mobilfunknetzen über
große Mengen an gesammelten Positionsdaten, deren Analyse und
Speicherung neue Herausforderungen bedeuten. Ziel dieses Projektes ist
die Entwicklung von Spatio-Temporal Datamining Techniken um
Bewegunginformationen zu extrahieren, um diese Location-Based Services
zur Verfügung zu stellen.
Unter den verschiedenen positionsbewussten Infrastrukturen sind
Mobilfunknetze die interessantesten Plattformen für Location-Based
Services, da deren Verfügbarkeit im Vergleich zu MANETs sehr hoch
ist, größere Flächen abgedeckt sind und eine
große Zahl von Nutzern erreicht wird. Dieses Projekt wird daher
einen Datensatz eines Mobilfunkbetreibers verwenden, um darauf
Spatio-Temporale Datamining Techniken zu entwickeln, um Bewegungsmuster
zu bestimmen und über einen längeren Zeitraum vorherzusagen.
Diese Techniken können von Mobilfunkbetreibern sowie von Anbietern
von Location-Based Services verwendet werden.
- Betreuer: Joos-Hendrik Böse (boese[at]mi.fu-berlin.de),
Xiujum Ma (maxiujunpku[at]gmail.com)
- Vergeben an: Jintao Ding und Chaojing Yang