Web 3.0: „Semantic Web“ – Orientierung im Datenmeer

Noch bevor sich das interaktive „Web 2.0“ mit seinen sozialen Netzwerken wie Facebook oder Twitter etablieren konnte, wurden Möglichkeiten erdacht, wie man in einem „Web 3.0“ semantische, also Bedeutungszusammenhänge sichtbar machen könnte. Nach anderthalb Jahrzehnten wartet das „Semantic Web“ trotz vielversprechender Ansätze immer noch auf seinen Durchbruch. Das Alumniportal sprach darüber mit Daniel Pfirrmann.

Daniel Pfirrmann ist Geschäftsführer der DiOmega GmbH, einer Full-Service-Agentur für IT- und Web-Dienstleistungen, Multimedia-Anwendungen, mobile Applikationen und webbasierte Schulungen, die er 2006 zusammen mit Dominique Bös gegründet hat. Sein persönliches Spezialgebiet ist „Big Data“.

Frage: Herr Pfirrman, nach aktuellen Schätzungen wird die 2016 durch die globalen Netze übertragene Datenmenge auf über ein Zettabyte anwachsen. Eine schier unvorstellbare Größe – im wahrsten Sinne des Wortes „Big Data“. Im „Web 3.0“, dem „Semantic Web“, soll man in diesem Datenmeer trotzdem noch finden können, wonach man sucht. Wie muss man sich das vorstellen?

Daniel Pfirrmann: Das Internet, wie wir es heute kennen, ist für Menschen entwickelt worden. Das semantische Web oder Web 3.0 macht es möglich, Informationen so aufzubereiten, dass sie von Maschinen verarbeitet werden können. Das Semantic Web ist also eine intelligente Verknüpfung von Daten: Dabei werden Informationen zueinander in logische und semantische Beziehungen gesetzt und automatisch interpretiert und eingeordnet. Grundlage dafür sind vor allem Metadaten, welche alle relevanten Angaben zur Beziehung der Informationen untereinander beinhalten.

Web 3.0: Relevante Informationen automatisch ordnen

Frage: Wie müssen die Daten dafür aufbereitet werden? Gibt es Praxis-Beispiele, an denen sich heute schon zeigen lässt, was man sich davon erwarten darf?

Daniel Pfirrmann: Eine Datenverknüpfung sieht zum Beispiel so aus: Frankfurt<Stadt> liegt am Main<Fluss>. „Stadt“ und „Fluss“ sind hier die sogenannten Metadaten. Technische Grundlage für die Beschreibung sind hauptsächlich das Resource Description Framework (RDF) und die Web Ontology Language (OWL).

Ein bekanntes Beispiel für das Web 3.0 ist DBpedia. Hier werden Daten aus Wikipedia in ein semantisches Format gebracht. So kann man wesentlich strukturierter und gezielter auf die Daten zugreifen. Beispielsweise lässt sich so auf einfache Weise eine Liste aller Städte mit mehr als zwei Millionen Einwohnern abfragen. Alle für diese spezifische Suchanfrage relevanten Informationen werden automatisch geordnet und angezeigt.

Ein weiteres Beispiel für eine der ersten Semantic-Web-Anwendungen ist FOAF (Friend of a Friend), ein Projekt zur maschinenlesbaren Modellierung sozialer Netzwerke. Soziale Beziehungen im Internet lassen sich so ordnen, analysieren und visualisieren.

Semantic Web – Eine Einführung

Semantic Web: Metadaten machen zusätzliche Arbeit

Frage: Dass es immer schwieriger wird, sich in einem rasant wachsenden Datenmeer zu orientieren, hat man ja bereits vor der Jahrtausendwende erkannt. Schon damals lautete die Antwort auf die Frage nach dem Internet der Zukunft „Semantic Web“. Warum spricht man bei diesem semantischen Web immer noch von einem „Zukunftsprojekt“? Was ist so schwierig an der Umsetzung?

Daniel Pfirrmann: Trotz erster, sehr vielversprechender Vorstöße gibt es leider verschiedene, teilweise nicht gelöste Probleme bei der Etablierung des Semantic Web. Zuallererst bedeutet die zusätzliche Anreicherung der Dokumente mit maschinenlesbaren Informationen, den Metadaten, natürlich zusätzliche Arbeit. Autoren müssen neben der Erstellung des Textes selbst auch noch für korrekte und sinnvolle Keywords sorgen.

Frage: Oder die Anbieter der Inhalte müssen dies nachträglich tun – das bedeutet natürlich einen erheblichen Aufwand, den man nur betreibt, wenn man sich davon einen eigenen Nutzen verspricht.

Daniel Pfirrmann: Des Weiteren ist die Missbrauchsgefahr der Metadaten nicht zu unterschätzen. Beispielsweise versuchen manche Webseitenbetreiber mithilfe der HTML-Meta-Tags, ihre Positionierung in den Suchmaschinen zu verbessern – ungeachtet dessen, ob die Metainformationen zutreffen oder nicht.

Ein weiteres Problem, etwa beim Projekt FOAF, ist die weiter sinkende Schwelle für das Eindringen in die Privatsphäre. Im semantischen Web ist es einfacher denn je, die persönlichen Vorlieben, Abneigungen oder Hobbys von anderen zu erfahren, indem man maschinell in sozialen Netzen nach Informationen zu dem Nutzer sucht. Werbetreibende können diese Informationen nutzen, um Werbung entsprechend Lebensstil, Freunden, Einkommen oder Neigungen noch sehr viel passgenauer zu personalisieren.

Je nach der eigenen Perspektive kann man das negativ oder auch positiv empfinden. Allerdings gibt es ja auch noch andere Branchen, die sich für solche Metadaten interessieren. Doch das wollen wir hier jetzt nicht vertiefen. Vielen Dank für das Gespräch!