Aufgabenstellung zum Software-Praktikum
im Sommersemester 2014


CCI-14 - Continuous Integration of Chess Data

Betreuer: Dr. Axel Ngonga, Dr. Jens Lehmann

Tutor: Franz Teichmann

Beschreibung: Schach gehört zu den ältesten Spielen der Welt. Es wurden mittlerweile Millionen von Schachpartien bei Tausenden von Spielern dokumentiert. Jedoch sind die Daten über Schach auf unterschiedlichen Webseiten verteilt und semantisch heterogen. Somit können zur Zeit Fragen wie «Welche Spieler aus Deutschland mit einer Elo über 2500 haben im Jahr 2007 in China gespielt»?

Um die Beantwortung solcher Fragen zu ermöglichen soll im Rahmen dieses Praktikums eine Architektur für die kontinuerliche Integration von Schachdaten umgesetzt werden. Ein Crawler soll Schachdaten aus dem Web sammeln und speichern. Spezialisierte Extraktoren sollen dann diese Daten entsprechend vorgegebener Ontologien nach RDF transformieren. Die Integration erfolgt über Linking.

Als Ergebnis des Praktikums sollen sowohl die dokumentierten Software Werkzeuge als auch ein Triple Store mit Daten vorliegen. Sie können auf Vorarbeiten aus dem SS 2013 sowie ein Integrationsframework LIMES aufbauen.