Definition: “The Semantic Web is not a separate Web but an extension of the current one, in which information is given well-defined meaning, better enabling computers and people to work in cooperation.”
Ziel des Semantischen Webs ist es, die Bedeutung von Informationen für Computer verwertbar zu machen und damit automatisch für die interessierten Nutzer im Zuge einer Abfrage zu ordnen. Die Informationen im Web sollen von Maschinen interpretiert und automatisch weiterverarbeitet werden können. Informationen über Orte, Personen und Dinge sollen mit Hilfe des Semantischen Webs auf der Basis der Inhalte miteinander in Beziehung gesetzt werden können (vgl. Wikipedia)
Das Sematische Web ist damit eine Zukunftsversion des jetzigen World Wide Web, in dem die Inhalte so aufbereitet sind, dass sie nicht nur für Menschen, sondern auch für Maschinen lesbar und interpretierbar sind. Dadurch könnten beispielsweise Suchmaschinen optimale Treffer liefern. Derzeit sind die Suchmaschinen mehr auf Vermutungen angewiesen – basierend auf einigen Regeln ordnen sie die gefundenen Seiten so, dass diejenigen oben stehen, die am wahrscheinlichsten die gesuchten Informationen enthalten (cf. Jacobsen 2009).
Das Semantic Web, derzeit das Thema einer W3C Arbeitsgruppe, ist eine Vision von Tim Berners-Lee, dem Erfinder des World Wide Web. Das WWW hat unsere Kommunikationsstrukturen, unsere Geschäftsprozesse, die Suche nach Informationen und Unterhaltung revolutioniert – es hat unser tägliches Leben tiefgreifend verändert. Als nächsten Schritt in der Entwicklung des Internet definiert Berners-Lee das Semantic Web als ein “Netz von Daten, die direkt und indirekt von Maschinen verarbeitet werden können.”
Eine Vision des Semantic Web wurde schon 2001 im Scientific American von Tim Berners-Lee, James Hendler und Ora Lassila vorgestellt:
At the doctor’s office, Lucy instructed her Semantic Web agent through her handheld Web browser. The agent promptly retrieved information about Mom’s prescribed treatment from the doctor’s agent, looked up several lists of providers, and checked for the ones in-plan for Mom’s insurance within a 20-mile radius of her home and with a rating of excellent or very good on trusted rating services. It then began trying to find a match between available appointment times (supplied by the agents of individual providers through their Web sites) and Pete’s and Lucy’s busy schedules. (The emphasized keywords indicate terms whose semantics, or meaning, were defined for the agent through the Semantic Web.)
(Dazu: Zusammenfassung der Informatics Review)
Ein weiteres Szenario beschreibt Altova:
“Ihre Firma muss ein dringendes Projekt in ihrer Zweigniederlassung in San Francisco durchführen, für das sie Sie als Berater benötigt. Sie bittet Sie, so bald wie möglich nach San Francisco zu fliegen, um mit der Arbeit zu beginnen. Sie nehmen Ihren Handheld Computer zur Hand, aktivieren den Semantic Web Agenten und weisen ihn an, einen Non-Stop-Flug nach San Francisco zu buchen, der morgen noch vor 10 Uhr Vormittag abfliegt. Wenn möglich hätten Sie gerne einen Sitz am Gang. Sobald Ihr Agent einen passenden Flug findet, in dem noch ein Sitz am Gang frei ist, bucht er den Flug mit Ihrer American Express Card und weist die Kosten in Ihrer Buchhaltung dem Konto Ihres Kunden zu. Gleichzeitig weist er Sie darauf hin, dass Sie daheim einen Zahnarzttermin versäumen und fügt eine Anmerkung zu Ihrem Kalender hinzu, dass Sie den Termin verschieben müssen. Als nächstes geben Sie an, dass Sie eine Limousine benötigen, um zum Büro des Kunden zu gelangen. Ihr Agent sucht daraufhin nach Limousinen-Services mit der Service-Bewertung “sehr gut” und bucht einen Fahrer, der Sie 30 Minuten nach Ankunft des Flugzeugs abholt. Außerdem reserviert Ihnen Ihr Agent ein Zimmer in Ihrem Lieblingshotel in San Francisco und sichert Ihnen dabei mit Ihrer Reward Card-Nummer den günstigsten Preis. Schließlich aktualisiert der Agent Ihren Terminkalender und den Ihres Chefs, trägt die Reiseinformationen ein und druckt die Reisebestätigungen im Büro aus.”
Altova: Der Semantic Web Agent basiert nicht auf Artificial Intelligence, sondern auf strukturierten Gruppen von Informationen und Inferenzregeln, die es ihm erlauben, die Beziehungen zwischen verschiedenen Datenressourcen zu “verstehen”. Der Computer versteht die Informationen dabei nicht wie ein Mensch, kann aber auf Basis der vorhandenen Informationen logische Verbindungen herstellen und Entscheidungen treffen.
Zur Implementierung des Semantic Web müssen semantische Metadaten, also Daten, die Daten beschreiben, zu Informationsquellen hinzugefügt werden, sodass Maschinen die Daten anhand der beschreibenden semantischen Informationen effektiv verarbeiten können.
Wenn genug semantische Informationen mit den Daten verknüpft sind, können Computer Rückschlüsse über die Daten ziehen, d.h. sie können verstehen, worum es sich bei der Datenressource handelt und in welchem Zusammenhang sie mit anderen Daten steht.
Zur Verwendung des Semantic Web müssen Daten aus verschiedenen Domains anhand ihrer Eigenschaften und Beziehungen zu anderen Daten klassifiziert werden. Zu diesem Zweck werden Semantic Web-Technologien wie RDF, RDFS und OWL verwendet.
RDF (Resource Description Framework), eine offizielle W3C Recommendation, ist ein XML-basierter Standard zur Beschreibung von Ressourcen im Internet, Intranet und Extranet. RDF baut auf bestehenden XML- und URI (Uniform Resource Identifier)-Technologien auf, wobei URIs zum Identifizieren der einzelnen Ressourcen und zur Angabe von Statements über Ressourcen dienen. RDF Statements beschreiben eine Ressource (die durch eine URI identifiziert wird), die Eigenschaften einer Ressource und die Werte dieser Eigenschaften. RDF Statements werden oft als “Triples” bezeichnet. Durch Erstellung von Triples mit Subjekt, Prädikat und Objekt in RDF können Maschinen logische Annahmen auf Basis der Assoziationen zwischen Subjekt und Objekt machen. RDF bietet zwar ein Model und eine Syntax zum Beschreiben der Ressourcen, gibt aber keinen Aufschluss über die Semantik (die Bedeutung) der Ressourcen. Zur Definition der Semantik werden RDFS und OWL benötigt.
RDFS (RDF Schema) dient zum Erstellen von Vokabularen, die Gruppen verwandter RDF-Ressoucen und die Beziehungen zwischen diesen Ressourcen beschreiben. Aufbauend auf demselben Triples-Modell wie bei RDF, bestehen RDFS-Triples aus Klassen, Klasseneigenschaften und Werten, die die Klassen und Beziehungen zwischen den Ressourcen in einer bestimmten Domain definieren. Grob gesprochen ist RDFS eine einfache Vokabularsprache zur Beschreibung der Beziehungen zwischen Ressourcen. OWL baut auf RDFS auf und ist ein viel umfangreicheres Vokabular zur Definition von Semantic Web Ontologien.
OWL (Web Ontology Language) ist die dritte W3C-Spezifikation zur Erstellung von Semantic Web Applikationen. Aufbauend auf RDF und RDFS definiert OWL die Arten von Beziehungen, die in RDF mittels eines XML-Vokabulars ausgedrückt werden können, um die Hierarchien und Beziehungen zwischen verschiedenen Ressourcen zu veranschaulichen. Und genau das ist die Definition von “Ontologie” im Zusammenhang mit dem Semantic Web: Ein Schema, das die Hierarchien und Beziehungen zwischen verschiedenen Ressourcen ausdrücklich definiert. Semantic Web-Ontologien bestehen aus einer Taxonomie und einer Reihe von Inferenzregeln, anhand derer Maschinen logische Schlüsse ziehen können (cf. Altova).
Zusätzlich zu den hier beschriebenen Technologien sind auch sogenannte “Proof”-Funktionen bei Semantic Agents vorgesehen, die es Menschen gestatten, die Schritte des Semantic Web Agent, mit denen er zu einer bestimmten Schlussfolgerung gekommen ist, zurückzuverfolgen. Außerdem gibt es Sicherheits- und Trust-Mechanismen in Form von digitalen Signaturen.
Bewertung der Vision des Semantic Web durch Altova:
Beachten Sie, dass die Implementierung von RDF, OWL und dem Semantic Web schrittweise erfolgen wird. Die Fragen: “Was ist das Semantic Web?” und “Wie können es Unternehmen und Einzelpersonen zu ihrem Vorteil nutzen?” erinnern an die anfängliche Verwirrung über den Nutzen von HTTP und das Internet, bevor “WWW” in die Alltagssprache Einzug fand. In Anbetracht des steilen Aufschwungs dieser Technologien ist es aber wahrscheinlich, dass auch die Vision des Semantic Web eines Tages Wirklichkeit werden wird, wenn auch anfangs nur in kleinem Rahmen.
Außerdem wird das Semantic Web – wie derzeit auch Webservice-Implementierungen – anfangs möglicherweise auf Intranet- und Extranet-Applikationen beschränkt bleiben, bis die Probleme der Informationssicherheit zufriedenstellend gelöst sind.
Welche Auswirkungen das Semantic Web haben wird, wird sich erst viel später zeigen, die Möglichkeiten sind jedoch atemberaubend. Einige Verfechter des Semantic Web behaupten, dass es zu einer Evolution des menschlichen Wissens selbst führen wird, da es Menschen dadurch zum ersten Mal möglich sein wird, die Unmengen der auf dieser Welt vorhandenen Daten auf relevante und produktive Art zu filtern und zu kombinieren.
Quellen:
• http://semanticweb.org/wiki/Semantic_Web
• http://de.wikipedia.org/wiki/Semantisches_Web
• http://semantisches-web.net/einleitung/definition/
• http://www.w3.org/2001/sw/
• A scenario: http://www.scientificamerican.com/article.cfm?id=the-semantic-web (u.a. von Tim Berners-Lee, dem Begründer des World Wide Web)
• A scenario: http://www.altova.com/de/semantic_web.html (Altova ist ein Unternehmen mit Sitz in Österreich und den USA & Markführer im Bereich XML-Entwicklungstools)
• Jens Jacobsen (2009): Website Konzeption.Addison-Wesley Verlag, München, S. 53
• Diplomarbeit mit dem Titel „Chancen und Auswirkungen des semantischen Webs“ (von Holger Sistig) unter http://semantisches-web.net/
• Lektüre zum Thema unter http://semantic-web-grundlagen.de/wiki/Semantic_Web_%E2%80%93_Grundlagen
• Tim Berners-Lee ursprüngliche Vision des WWW: http://www.w3.org/People/Berners-Lee/Weaving/
• Zusammenfassung Informatics Review: http://www.informatics-review.com/thoughts/semantic.html