Aufgabenstellung zum Software-Praktikum im Sommersemester 2012


LGM-1 – LinkedGeoData Management

Betreuer: Claus Stadler


Das Ziel von "OpenStreetMap" [1] ist die Erstellung einer freien Karte der Welt. Das Projekt folgt dabei einem ähnlichen Prinzip wie Wikipedia, welches es Nutzern ermöglicht, kollaborativ geographische Daten zu editieren. Die Modellierung erfolgt über "Knoten", "Wege", und "Relationen", mit deren Hilfe sich geometrische Objekte (Punkte, Linienzüge, und Polygone) realisieren lassen, welche zusätzlich mit einer Menge von Tags (Schlüssel-Wert-Paaren) beschrieben werden können. Die Daten, welche frei heruntergeladen werden können [2,3], enthalten beispielsweise bereits mehr als eine Milliarde Knoten.

Im Zuge unseres "LinkedGeoData" (LGD) Projekts [4] werden diese Daten mittels eines auf den Tags basierenden Mapping-Prozesses nach RDF konvertiert und somit in der Semantic Web Infrastruktur nutzbar gemacht. Zusätzlich existiert noch eine leichtgewichtige Ontologie, in welche die generierten RDF Ressourcen eingeordnet werden.
Derzeit werden die Mappings und die Ontologie nur durch den LGD-Administrator in einer relationalen Datenbank verwaltet [5].

Ausgeschrieben wird die Implementierung einer Webapplikation, welche vor allem folgende zwei Punkte ermöglichen soll:

Unterstützend soll dabei die Applikation anhand von Statistiken automatisch Vorschläge machen z.B. für bisher auf LGD nicht gemappte bzw. auf OSM nicht mehr genutzte Tags.

[1] http://openstreetmap.org
[2] Komplette Dumps http://planet.openstreetmap.org/
[3] Regionale Datensets (hier: Deutschland) http://download.geofabrik.de/osm/europe/germany/
[4] http://linkedgeodata.org
[5] http://code.google.com/p/linkedgeodata/source/browse/trunk/3/src/main/sql/Mappings.sql

Beispiel: Die Knoten #890992490 und #401788307 sind derzeit getaggt mit (cuisine, sushi) und (cuisine, regional). Die entsprechenden RDF Tripel auf LGD haben aktuell folgende Form:
<http://linkedgeodata.org/triplify/node890992490> <http://linkedgeodata.org/property/cuisine>  "sushi" .
<http://linkedgeodata.org/triplify/node401788307> <http://linkedgeodata.org/property/cuisine>  "regional" .

Ein Nutzer der LGD Daten könnte nun argumentieren, dass statt der Literale "sushi" und "regional" besser Ressourcen wie <http://linkedgeodata.org/ontology/cuisine/Regional> verwendet werden sollten, z.B. damit er diese mit einem Label oder einem Kommentar annotieren kann.

Der Nutzer soll daher in die Lage versetzt werden, über die Webapplikation festzulegen, dass die Werte von Tags mit dem Schlüssel "cuisine" auf entsprechende Ressourcen gemappt werden sollen.

Weiterhin könnte es dem Nutzer plausibel erscheinen, in der Ontologie festzulegen, dass "Cuisine/Sushi" eine Subklasse der japanischen Küche ist:
<http://linkedgeodata.org/ontology/cuisine/Sushi>  <http://www.w3.org/2000/01/rdf-schema#subClassOf>  <http://linkedgeodata.org/ontology/cuisine/Japanese>