Die DBPedia ist ein gemeinsames Projekt der Universitäten Leipzig und Berlin mit dem Ziel aus der Wikipedia strukturierte Daten herauszulösen. Statt Volltextsuche (die bei einem der Demo-Interfaces aber auch angeboten wird) also semantische Suche. Dieses Vorgehen ist nicht ganz trivial, da die Daten und die Ontologie in der Wikipedia nicht so ganz den Anforderungen für eine automatisierte Verarbeitung erfüllen (sonst wäre das Projekt ja auch in Teilen überflüssig).
Vor zwei Wochen kam jetzt ein neuer Datenbestand zum Download heraus mit Fakten über etwa 2.4 Millionen Entitäten, darunter mehr als 80,000 Person, 293000 Orte, 62000 Musikalben und 36000 Filme. Das Ganze wissensfreundlich unter der GNU Free Documentation License lizensiert.
Sehr praktisch um überhaupt einmal zu sehen, was man mit semantischen Daten alles anfangen kann, ist http://wikipedia.aksw.org/. Hier kann man sich anhand von Beispielqueries durch den Datenbestand wühlen und sie beliebig verändern. Das Userinterface ist simpel und gibt trotzdem schon einen kleinen Vorgeschmack auf SPARQL.






