Schema.org: Ein Schritt Richtung Web 3.0
Zum Internet verspüren viele Verlage eine Art Hassliebe. Vor allem auch Google gegenüber und noch mehr gegenüber dessen Angebot “Google News”. Das zerrüttete Verhältnis dürfte einen weiteren Knacks erhalten. Denn in ungewohnter Einigkeit mit den Konkurrenten Microsoft (Bing) und Yahoo führt der Suchmaschinenriese eine neue Auszeichnungssprache für das Web ein – mit Konsequenzen auch für Leser.
Schema.org besteht bislang aus circa 300 Attributen, mit denen sich im HTML-Code einer Internetseite Informationen wie Orte, Personen, Veranstaltungen oder Produkte kennzeichnen lassen. Der Besucher einer Internetseite selbst sieht diesen Code nicht – sein Browser aber setzt daraus den Inhalt der Seite zusammen. Und Suchmaschinen, die in regelmässigen Abständen große Teile des Internets immer wieder kartieren (“crawlen”), lesen diese Auszeichnungen und speichern sie ab – sie indexieren.
Schema.org geht nun ins Detail. Beispielsweise kann ein Onlineartikel zu einer Person mit über 25 verschiedenen Angaben ausgezeichnet werden: Etwa “birthDate”, “jobTitle” oder “gender”. So wird es Suchmaschinen möglich, Zusammenhänge herzustellen und die Bedeutung von Informationen zu “verstehen”. User können etwa verlangen, alle Personen mit einem speziellen Geburtsdatum aus ein und dem selben Ort angezeigt zu bekommen.
Auf den Spuren von Tim Berners-Lee
Schema.org könnte so dem Semantic Web, manchmal auch Web 3.0 genannt und vom WWW-Entwickler Tim Berners-Lee bereits 2001 beschrieben, einen gehörigen Schub verleihen. Allerdings stößt das Vorhaben auf ein geteiltes Echo in der Semantic-Web-Community. Dort gibt es schon etablierte und vor allem freie Standards wie RDFa. Die könnten nun ins Hintertreffen geraten, so die Befürchtung.
Die Suchmaschinenbetreiber haben, so behaupten sie, nur das Wohl der User im Visier: Es ginge ihnen schlicht darum, bessere Ergebnisse zu liefern. Das ist sicherlich nicht unwahr, denn am besten für Google & Co. ist es, wenn die Nutzer auf den eigenen Seite bleiben. Denn so sind sie länger der Werbung der Anzeigenkunden der Suchmaschinen ausgeliefert.
Wohin die Reise geht, ist im wörtlichen Sinne schon in den Suchergebnissen von Google zu sehen. Gibt man da heute beispielsweise “Flug Berlin London“ ein, wird der Flugplan aller Direktflüge für diese Verbindung angezeigt. Dass sich demnächst Flugpreise direkt bei Google vergleichen und die Tickets gleich kaufen lassen, ist zu erwarten. Auch andere Inhalte werden schon direkt in den Suchergebnissen angezeigt, etwa Kinoprogramme, Wetterinformationen oder Börsenkurse.
Schema.org wird es Google (und Bing/Yahoo) ermöglichen, den Nutzern noch mehr Informationen direkt anzuzeigen. Für einige Geschäftsmodelle, die von Klickzahlen oder Provisionen (“affiliate”) leben, könnte sich das zu einem Problem entwickeln. Aus dem gleichen Grund stellt schema.org auch für Medienanbieter ein Problem dar. Google News könnte sich zu einem mächtigen Konkurrenten entwickeln. Zu einem Informationsanbieter, der nunmehr nicht nur eine Übersicht über Nachrichtenartikel präsentiert, sondern – automatisiert zusammengestellt – die Nachricht selbst. An solchen Systemen wird schon länger gearbeitet: Robotorjournalisten schreiben schon ganz passable Sportberichte aus Basisinformationen über ein Spiel zusammen.
Robotorjournalisten bereits am Werk
Was heißt das für den User? Schema.org wird ihm nutzen, weil es die Qualität steigern kann. Es sind Dienste denkbar, die automatisch Onlinenmedien vergleichen. Sie überprüfen sie etwa auf ihre faktische Richtigkeit: Stimmen Orts- und Zeitangaben und biographische Details einer Person?
Voraussetzung ist allerdings, dass Onlinepräsenzen von Zeitungen, Zeitschriften und Sendern bei der semantischen Auszeichnung mitmachen. Aber bleibt ihn etwas anderes übrig? Größere Medienunternehmen geben schon jetzt viel Geld für Suchmaschinenoptimierung (SEO) aus. Wenn sie weiter halbwegs weit oben in den Suchergebnissen auftauchen wollen, müssen sie an schema.org teilnehmen. Die Zwickmühle: So liefern sie Suchmaschinen eben den Stoff, mit denen die automatisch Informationen generieren.
Dem Nutzer dürfte es allerdings herzlich egal sein, ob er eine automatisierte Zusammenfassung über einen Vorgang bei Google News liest. Oder ähnlich klingende dpa-Meldungen oder leicht bearbeitete Pressemitteilungen auf irgendeinem Nachrichtenportal.
Um nicht überflüssig zu werden, müssen Onlinemedien sich also mehr Gedanken über ein eigenes Profil machen. Das können sie mit eigenen Reportagen, Analysen und Kommentaren schärfen. Diese Genre werden wohl nie automatisiert per Software erstellt werden. Aber – werden sie per schema.org ausgezeichnet – können sie besser von Suchmaschinen als genuine Inhalte erkannt und mit einer guten Position in den Suchergebnissen prämiert werden.
Wichtig wird es auch sein, als Medium selber semantische Auszeichnungen schlau zu nutzen. Nicht nur zu geben, sondern auch zu nehmen. Der britische “Guardian” macht es derzeit vor, wie er so sein Angebot rund um das Gastonbury Musikfestival anreichert: Die jeweils einzelnen Seiten zu den Musikern werden neben eigenen Texten automatisiert mit Inhalten von last.fm, YouTube und Wikipedia ergänzt.
(Das ZDF ist für den Inhalt externer Internetseiten nicht verantwortlich)
5 Kommentare | 30. Juni 2011 | 14:30 Uhr |
|

ich glaube, dass eigene recherche auch jetzt schon recht selten ist und so wohl auch nicht unbedingt mehr geschürt wird, aber lassen wir uns überraschen …
Hier ein exzellenter Vergleich zwischen Microformats und den anderen Formaten RDFa und Microdata:
http://manu.sporny.org/2011/uber-comparison-rdfa-md-uf/
Einer meiner Kollegen hat zu dem Thema schema.org ebenfalls einen sehr interessanten Artikel mit eineigen Beispielen verfasst unter http://zonkbros.com/schema-org-and-its-implications-on-seo
Good post about Ein Schritt Richtung Web 3.0
is there any wiki for semantic-web so i can read more?