Neue Version der DBPedia

Die DBPedia ist ein gemeinsames Projekt der Universitäten Leipzig und Berlin mit dem Ziel aus der Wikipedia strukturierte Daten herauszulösen. Statt Volltextsuche (die bei einem der Demo-Interfaces aber auch angeboten wird) also semantische Suche. Dieses Vorgehen ist nicht ganz trivial, da die Daten und die Ontologie in der Wikipedia nicht so ganz den Anforderungen für eine automatisierte Verarbeitung erfüllen (sonst wäre das Projekt ja auch in Teilen überflüssig).

Vor zwei Wochen kam jetzt ein neuer Datenbestand zum Download heraus mit Fakten über etwa 2.4 Millionen Entitäten, darunter mehr als 80,000 Person, 293000 Orte, 62000 Musikalben und 36000 Filme. Das Ganze wissensfreundlich unter der GNU Free Documentation License lizensiert.

Sehr praktisch um überhaupt einmal zu sehen, was man mit semantischen Daten alles anfangen kann, ist http://wikipedia.aksw.org/. Hier kann man sich anhand von Beispielqueries durch den Datenbestand wühlen und sie beliebig verändern. Das Userinterface ist simpel und gibt trotzdem schon einen kleinen Vorgeschmack auf SPARQL.

Gefallen? Mitteilen! Bookmarken! Diese Icons verlinken auf Bookmark Dienste bei denen Nutzer neue Inhalte finden und mit anderen teilen können.
  • MisterWong
  • Y!GG
  • Digg
  • del.icio.us
  • StumbleUpon
  • TwitThis
Dieser Eintrag wurde veröffentlicht in Datasets und getagged , , . Bookmarken: Permanent-Link. Kommentieren oder ein Trackback hinterlassen: Trackback-URL.

Ihr Kommentar

Ihre E-Mail wird niemals veröffentlicht oder verteilt. Benötigte Felder sind mit * markiert

*
*

Du kannst diese HTML Tags und Attribute verwenden: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>