Fachlich kompetent
Äußerst flexibel
Absolut zuverlässig
SEO

Das Semantic Web: Die Zukunft des Internets

2015-09-30
Seokratie
Seokratie GmbH
Main address: Blutenburgstr. 18 D-80636 München, Deutschland ,
Tel:089 - 219098411 , E-mail: mail[@]seokratie.de
von Julian Dziki 3. Mai 2013 11 Kommentare

Schon seit Längerem wollte ich einmal über das semantische Web schreiben, weil ich mich in meiner Magisterarbeit damit befasst habe. Obacht: Das wird heute kompliziert, aber es lohnt sich! 🙂

Tim Berners-Lee, der Erfinder des Internets und von HTML, verfasste im Jahr 2001 im Scientific American den wegweisenden ArtikelThe Semantic Web, in dem er seine Vision vom Internet der Zukunft skizzierte. 80 % der weltweit verfügbaren Information liegt in unstrukturierter Form vor. Für Menschen haben (zumindest die meisten) Texte eine Bedeutung, für Computer aber nicht. Tim Berners-Lee forderte in seinem Artikel, dass wir Menschen das Internet um die Ebene der Bedeutung (=Semantik) erweitern müssten. Er skizzierte sogenannte Suchagenten, die weit mehr leisten könnten als heutige Suchmaschinen.

Tim Berners Lee
Verneigt Euch vor ihm, wenn Ihr ihn mal trefft: Tim Berners-Lee hat das Internet erfunden! Und das Semantic Web.

Suche + Bedeutungsebene = Suchagent

Um seine Idee zu verdeutlichen, griff er im Artikel auf das Beispiel einer Frau zurück, die einen Arzttermin vereinbaren möchte. Der Suchagent präsentiert nach einer Suchanfrage für einen Arzt nicht nur  (wie heute) die Ergebnisse, sondern übernimmt ähnliche Aufgaben wie ein Sekretär. Er sieht zum Beispiel auch nach, welche Therapeuten in Reichweite der suchenden Frau sind. Er vergleicht die Mediziner miteinander, wobei er Bewertungen anderer Patienten berücksichtigt. Hat er einen guten Arzt in der Nähe gefunden, gleicht er den Terminkalender der Frau mit den freien Terminen des Spezialisten ab. Eine einfache Suchanfrage führt also im Hintergrund gleich mehrere Schritte aus, wobei verschiedene Agenten Informationen untereinander austauschen, in diesem Fall zum Beispiel der Agent des Arztes mit dem der Patientin.

Heraus kommt ein Vorschlag ihres Agenten mit allen Terminen des idealen Arztes, den die Patientin dann nur noch annehmen muss oder bei Nichtgefallen die Parameter ändert.  So kann sie die Suchanfrage etwa dahingehend verfeinern, dass sie einen weiteren Weg in Kauf nehmen würde, wenn sich dabei ein Arzt mit besseren Bewertungen fände.

Um diese Daten abrufen zu können, müssen Informationen im Web mit Bedeutungen angereichert werden. Dazu werden Texte mittels RDF (Ressource Description Framework) in sogenannte Tripel aufgeteilt, die in der Regel aus Subjekt, Prädikat und Objekt bestehen. Mit Hilfe von RDF ist bereits eine recht einfache Interpretation von Daten möglich, wie etwa:

Tim Berners-Lee (Subjekt) – Ist Autor von (Prädikat) – Semantic Web (Objekt).

Das Besondere daran ist, dass RDF webseitenübergreifend funktioniert. So ist das Prädikat ‚Ist Autor von‘ auch auf anderen Webseiten zu finden. Eine semantisch intelligente Internetressource kann deswegen dann auf anderen Seiten suchen, wo außerdem noch ‚Tim Berners-Lee ist Autor von‘ steht  und diese Inhalte dann aggregiert anzeigen. So findet eine semantisch intelligente Suchanfrage alle Bücher, die Tim Berners-Lee geschrieben hat. Dieses System haben wir heute bereits rudimentär live, beim Authorship-Markup von Google+. Allerdings erscheint es nur auf Seiten, bei denen der Autor mitwirkt und nicht auf Seiten, die über die Person Tim Berners-Lee in seiner Funktion als Autor berichten.

Was sind Ontologien?

Sogenannte Ontologien wie OWL (Web Ontology Language) stellen dann Kausalbeziehungen zwischen komplexeren Systemen her. Die Anwendungsgebiete von Ontologien sind vielschichtig. Eine Aufgabe ist es etwa, verschiedene RDF-Daten zusammenzuführen. Gibt es ein RDF mit dem Prädikat ‚hat geschrieben‘, so kann eine Ontologie dieses RDF mit dem Prädikat ‚ist Autor von‘ gleichsetzen. So können auch rückwirkend Texte ohne semantische Funktionen „upgegradet“ werden.

Außerdem besteht OWL aus Klassen, Instanzen, Eigenschaften und Operationen. Ohne jetzt zu sehr in technische Details zu gehen bedeutet das im Rückkehrschluss, dass ein und dasselbe Wort mehrere Bedeutungen haben kann und in mehreren verschiedenen Kontexten verwendet werden kann.

So kann im obigen Beispiel Tim Berners-Lee nicht nur ‚Autor von‘ , sondern auch ‚Vorgesetzter von‘ (einer Person) sein, wodurch das Subjekt Tim Berners-Lee mehrere Bedeutungen erhält und der Name eben nicht nur ein Symbol für „Autor“ ist. Auch könnte man das Prädikat ‚Ist Autor von‘ erweitern, in dem man ein weiteres Prädikat hinzufügt ‚ist wissenschaftlicher Autor von‘ und in dieser Bedeutung dann nur wissenschaftliche Autoren nennt, ohne Romanautoren, Blogger oder Redakteure bei Zeitungen.

Ontologien können ähnlich eines Wörterbuchs agieren, etwa beim Begriff ‚Nero‘. Eine geschichtswissenschaftliche Ontologie versteht darunter den römischen Kaiser, eine Software-Ontologie das gleichnamige Brennprogramm zum Brennen von DVDs. Oder beim Wort „SEO“ entweder den koreanischen Vornamen „SEO“ oder eben „Search Engine Optimization“.

Kausalzusammenhänge möglich!

Ebenso können Ontologien für Ausschlüsse und Kausalzusammenhänge stehen. So erkennen sie, dass ein Name mit der Bezeichnung ‚Taxifahrer‘ gleichzeitig auch die Eigenschaft ‚Personenbeförderungsschein‘ haben muss und während der Arbeit in München ein ‚gelbes Auto‘ fährt. Eine gute Ontologie weiß dann aber auch, dass im Umkehrschluss ‚gelbes Auto‘ nicht zwingend mit ‚Taxi‘ identisch ist, und dass ‚Personenbeförderungsschein‘ auch auf ‚Busfahrer‘ zutrifft. Kommt Ihr noch mit?

Wofür?

Stellt Euch vor, Ihr wollt die Namen aller Geschäftsführer von SEO Agenturen in München haben. Heute sucht Ihr nach „SEO Agentur München“, schaut in die Impressen und schreibt sie Euch heraus. Das macht das semantische Web in Zukunft für Euch. Nach der Suchanfrage bekommt Ihr die vollständige Liste mit Vor- und Nachnamen. Mit einem einfachen, weiteren Klick auch die Telefonnummern oder E-Mail Adressen. Oder Ihr sucht für Euer Kind einen Nachhilfelehrer, der selbst noch Schüler ist, Nachhilfe in Englisch gibt, in Eurer Nähe wohnt und Mittwochs von 16-18 Uhr Zeit hat? Eine Suchanfrage. Ein italienisches Restaurant, das gute Pizza und gleichzeitig guten Fisch anbietet und Freitag abends neben freien Tischen auch noch freie Parkplätze in der Umgebung hat? Auch nur eine Anfrage. Ihr merkt: Die momentanen Sucheinstellungen bei Google sind ein Witz, verglichen mit dem was kommen wird.

Praktische Beispiele

Praktische Beispiele von diesen theoretischen Möglichkeiten gibt es bisher nur sehr wenige. Google nutzt bereits einige semantische Funktionalitäten, etwa bei der Suche nach Rezepten. Wer etwa nach ‚chicken pasta‘ Rezepten sucht, findet neben bloßen Suchergebnissen auch Angaben zu den enthaltenen Zutaten und anderen Spezifikationen und kann damit auch seine Suche verfeinern. So kann man nach ‚chicken pasta‘ Rezepten suchen, deren Zubereitungszeit weniger als 30 Minuten benötigt und die mit Tomatensauce gemacht werden. Die Informationen dazu müssen die Rezept-Webseitenbetreiber Google im RDF-Format zusätzlich zu den Textinhalten zur Verfügung stellen. Das ist aber eigentlich nicht der Sinn: Eigentlich wäre es die Aufgabe von Google, diese Inhalte automatisch richtig zu erfassen – heute noch undenkbar. 

Im deutschsprachigen Raum gibt es zwei semantische Suchmaschinen, Semager und das ‚Wortschatz Portal‘ der Uni Leipzig. Beide arbeiten jedoch nur mit Kookorenzien und verstehen unter semantischer Suche die häufig vorkommenden „benachbarten“ Wörter zu einem Begriff zu finden. Von den eingangs genannten Einsatzmöglichkeiten sind heutige Suchmaschinen aber noch Jahre entfernt.

Willst Du fit in Online Marketing werden? Mit unserem Newsletter bekommst Du automatisch die neuesten Seokratie-Beiträge direkt in Dein Postfach! Hier geht es zum Anmeldeformular.

Entwicklung im Semantic Web?

Seien wir mal ehrlich: Im Vergleich zum obengenannten Suchagenten ist das, was Google & Co. uns bisher als Semantik verkaufen wollen absoluter Kindergarten und nicht mehr als „Herumprobieren“. Umso dramatischer, wenn man bedenkt, dass der Artikel von Tim Berners-Lee bereits 12 Jahre alt ist. Gleichzeitig aber ahnt Ihr vielleicht ein wenig, wie unglaublich komplex eine Programmierung von Suchagenten alleine für die Arztfindung wäre. Die Möglichkeiten wären aber enorm: Stellt Euch nur eine SEO-Konferenz vor, deren Termin anhand der Terminkalender von über 1.000 Teilnehmern erstellt wird. Vollautomatisch! Oder die eigene Geburtstagsparty anhand der freien Termine der Freunde zu planen?

Semantic Web im Praxisversuch: Medizin und Biologie

In den Naturwissenschaften, insbesondere in Medizin und Biologie, wird viel mehr mit dem Semantic Web experimentiert. Der Wissenschaftler David Shotton hat bereits 2008 einen Artikel semantisch aufbereitet und seine Ergebnisse dokumentiert. Auf der Webseite des Artikels können alle Nennungen von Personen, Krankheiten oder  Organismen grafisch hervorgehoben werden. So kann der Leser den Artikel bei der Suche nach bestimmten Informationen besser verarbeiten. Interessanter ist die Zusammenfassung des Artikels, in der sich die eigentliche semantische Leistung offenbart. Nix da mit „Rel=Author“, sondern es gibt hunderte von semantischen Begrifflichkeiten. Im Artikel werden die Informationen derart strukturiert angezeigt, dass eine maschinenlesbare Auswertung möglich ist.

  • Der Ort der Veröffentlichung etwa ist zusätzlich durch GEO-Koordinaten angegeben
  • Alle im Text auftauchenden Orte, nach Ländern und Kontinenten sortiert
  • Es sind alle beteiligten Institutionen übersichtlich untereinander angegeben
  • Ebenso alle Personen im Dokument, sortiert nach Autoren, erwähnten Personen und zitierten Personen
  • Alle im Text vorkommenden Proteine, alle Bakterien, alle Tierarten
  • Alle Symptome, Krankheiten, Krankheitsbilder und -folgen

Ebenso gibt es eine umfassende Zitationsanalyse, die aufzeigt welche Artikel wie oft zitiert wurden und in welchem Abschnitt des Textes, ob in Einleitung, Methodik oder Diskussion. Für sich alleine stehend ist der Artikel eher unspektakulär, aber viele dieser Aufsätze wären wissenschaftlich hochinteressant: So könnte man nach der Analyse vieler Texte die Grundlagenliteratur (Einleitung) von der aktuellen Forschungsdiskussion (Diskussion) automatisiert trennen. Wenn ein Aufsatz in vielen anderen Artikeln zitiert wird, könnte man so seine relative Wichtigkeit herausfinden – ohne den Text überhaupt gelesen zu haben. Überlegt Euch das mal zum Thema Links: Wird Eure Webseite eher in einleitenden Artikeln verlinkt oder nur in absoluten Expertenartikeln?

David Shotton gab an, dass eine Person etwa zehn Wochen für die semantische Bearbeitung des Artikels braucht. Dazu muss man aber beachten, dass in den Naturwissenschaften, insbesondere in der Medizin und Biochemie bereits mehrere semantisch funktionierende Ontologien existieren, aus denen Shotton sogar die geeignetsten auswählen konnte. Sie halfen bei der automatisierten Erkennung von Krankheitsbegriffen oder Personen als eben solche, wobei eine manuelle Nachbearbeitung trotzdem nötig war. Der Artikel steht zwar noch alleine da, aber im medizinischen Bereich zeigen bereits viele Zeitschriftenverlage Ansätze von semantischen Technologien. Wenn ich sehr viel Geld hätte, ich würde es in die Entwicklung von Onthologien stecken, die ich dann bald teuer verkaufen kann.

Fazit?

Ich hoffe, dass Ihr in dem Artikel in etwa nachvollziehen konntet, was wahrscheinlich auf uns zukommen wird. Überträgt man das auf die SEO Branche, dann werden wir in Zukunft noch wichtiger. Nicht mehr Keywordrecherche, sondern semantische Klassifikation werden in der Zukunft wichtig sein. Die Frage ist nicht ob, sondern wann das semantische Web endlich kommt. Meiner Meinung nach wird es noch sehr lange dauern. Denn auch wenn Google daran mit Hochdruck arbeitet, sind noch nicht einmal die Grundvoraussetzungen gegeben. Weder technisch, noch wirtschaftlich, noch gesellschaftlich. Der Anfang wurde mit der Rezepte-Suche bereits gemacht. Bis aber alle unsere Informationen strukturiert vorliegen und auch alte Informationen rückwirkend strukturiert werden, kann gut und gerne noch eine sehr lange Zeit vergehen. Ich wollte den Artikel eigentlich nur einmal veröffentlichen, damit Ihr seht, was mit dem Semantic Web wirklich gemeint ist. Es geht um weit mehr alt „Rel=Author“ oder Rezepte Suche. Es geht um die Katalogisierung und Strukturierung des gesamtlichen menschlichen Wissens.

Eure Meinung?

Brauchst Du Hilfe? Suchst Du eine kompetente, flexbile und zuverlässige Online-Marketing-Agentur? Wir freuen uns auf Deine unverbindliche Anfrage.
089 | 219 09 84 11 kontakt@seokratie.de Oder kontaktiere uns über das Formular: Jetzt kontaktieren
Über den Autor
Wie andere Fussballprofi werden wollten, so wollte Julian immer schon im Online Marketing arbeiten. Den Blog Seokratie.de startete er 2008 neben seinem Studium. Aus dem Hobby wurde sein Beruf: Heute ist er Geschäftsführer und Inhaber der Online Marketing Agentur Seokratie mit über 20 Mitarbeitern. Er ist Autor von "Suchmaschinen-Optimierung für Dummies", das 2018 im Wiley Verlag erschienen ist. Hier findest Du alle Beiträge von .

Kommentiere diesen Beitrag

Deine E-Mail Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.

11 Kommentare
  1. Vomitorium 3. Mai 2013

    >>
    Nicht mehr Keywordrecherche, sondern semantische Klassifikation werden in der Zukunft wichtig sein
    <<

    Heißt also, der SEO verkommt zum Data-Entry-Sklave? 😉

  2. Gerald 3. Mai 2013

    Hm ganz schön blöd wenn man bisher eine Dienstleistung überregional anbietet. Bei den weiter entfernt Suchenden würde man in diesem Fall wahrscheinlich nicht mehr auftauchen?

  3. Rainer 3. Mai 2013

    Es bleibt spannend. Ich konnte folgen. Danke. 🙂

    Im Prinzip kann man ja jetzt schon viel mehr als SEO machen. Stichwort Schema.org

  4. Mißfeldt 3. Mai 2013

    sehr spannend. Danke. Mit dem letzten Satz bin ich aber nicht glücklich 😉 Es geht doch um viel mehr als nur „um die Katalogisierung und Strukturierung des gesamtlichen menschlichen Wissens“, oder?
    Das Geheimnis sind doch die Suchanfragen, die noch nie gestellt wurden und für die es direkt noch keine Antworten gibt. Der Algo muss also „kombinieren“ können. Und: nichts hat eine festgelegte Bedeutung. Viele Begriffe bedeuten für einzelne Menschen verschiedene Dinge. Individuelle Erfahrung prägt Begriffe, die dann in verschiedenen Kontexten unterschiedliche Bedeutung gewinnen. Und zum Dritten: Sprache ist komplex und differenziert und modischen Ternds unterworfen. Und zwar jede Sprache individuell. Das sematnische Web, von dem Berners-Lee spricht, ist nur denkbar, wenn diese individuellen Sichtweise und Haltungen ein Faktor im Algo werden. Daran arbeitet Google sicherlich, aber es ist ebenso erschreckend.

  5. Marco Janck 4. Mai 2013

    Ich will auch keine Welt (auch keine Internetwelt), die mir sagt, wie ich zu denken habe. Um das zu lösen müsste es Daten direkt aus meinem Kopf geben und das wollen wir ja alle nicht. Also nicht, weil es mein Kopf ist, hehe. @mißfeldt hat schon Recht. Die Vorstufe ist für mich zur Zeit der dynamisierte Inhalt. Will ich, dass mir gesagt wird, was ich denke ? Will ich in dieser Denke dann gefangen bleiben ? Das wird in Zukunft sehr schwierig, aber danke für den Post, Julian.

  6. Michael Rutsch 18. Mai 2013

    Also bitte…
    glaubt ernsthaft jemand, dass das funktioniert?
    Am Beispiel SEO-Konferenz mit 1000 Teilnehmer:
    Okay – die Konferenz wird dann im Jahr 3597 stattfinden… wieso? Weil jeder Teilnehmer an einem Tag etwas anderes vorhat… Außerdem würde dafür eine vollkommene digitalisierung des Terminkalenders von nöten sein! Was für ein unnützer Haufen Arbeit. 99% der Menschen werden einen Termin wohl kaum aufschreiben. Beziehungsweise ihren Tagesablauf minutiös planen…

    Wie soll also der Suchagent für 1000 Teilnehmer einen Termin festlegen, wenn die 1000 Teilnehmer beispielsweise keinen vollständig minutiös erstellten Terminkalender haben…

    Und: Wie soll es funktionieren? Fakt ist: Viele Menschen nehmen sich für eine Konferenz Urlaub, bekommen frei oder verschieben Termine. Wenn der Suchagent aber nur die freien Tage abgleicht, kommt vermutlich wirklich ein Tag in ferner ferner ferner Zukunft voraus…

    MFG:Michael

  7. Björn 27. Mai 2013

    Bereits zur Jahrtausendwende während meines Studiums zum Informationswirt standen Begriffe wie semantic web im Raum. Allerdings hat sich die Entwicklung zu funktionierenden Systemen bisher nur sehr langsam weiter entwickelt weil die Thematik unglaublich komplex ist. Solange man sich in relativ eng begrenzten Themenräumen bewegt (Stichwort Rezepte) ist eine sematische Verknüpfung durchaus machbar, aber in völlig unstrukturierten Datenräumen wie dem www eine allgemeine sematische Suche zu verwirklichen (die dem Großteil der heterogen Suchenden gerecht wird) wird vermutlich nicht mit herkömmlicher Technik, wie wir sie heute kennen, zu verwirklichen sein. Erst mit einem gewissen Grad von „Verständnis“, also einer Art KI wird es imho möglich sein diesen heterogenen Wust an Informationen auch semantisch sinnvoll zu sortieren und zu verknüpfen. Zu viele Probleme müssen noch gelöst werden um auch nur Ansatzweise ein System zumindest in einem definierten Sprachraum (zB. Englisch)zu entwickeln, was oben angesprochenes Leisten können soll, als dass hier nicht noch viele viele Jahre ins Land gehen werden (oder aber eine neue innovative Technologie einen Quantensprung ermöglicht).

    mfg BJ

  8. Can von Werbewind 27. Mai 2013

    Guter Einwand von Michael!
    Aber sicherlich wird es auch hierfür „Kompromisse“ geben, die man mich einstellen kann. Sowas wie:
    „Termin steht fest, wenn 51% der beteiligten 1000 Zeit haben.“

    Irgendwas in diese Richtung. Aber ich kann mir sehr gut vorstellen, dass die ersten drei bis vier Updates noch viele Lücken haben werden, sich allerhand Leute beschweren würden und basierend darauf erst viel zu spät ein System entwickelt wird, das rund läuft.

    Aber bis dahin kann es dann halt auch passieren, dass es floppt, weil die Menschen keine Lust mehr drauf haben.

    Wir werden sehen, ob, wann und überhaupt das mal umgesetzt wird..

  9. Steffen Schojan 14. Oktober 2014

    Danke, ein sehr guter Artikel, der Einem science Fiction Film ähnelt. Sehr gut geschrieben und absolut verständlich.

    „Es geht um die Katalogisierung und Strukturierung des gesamtlichen menschlichen Wissens.“ Das wäre dann die Akasha Chronik im Internet.

Willst Du fit in Online Marketing werden?
 Mit unserem kostenlosen Newsletter bekommst Du 2 bis 3 Mal pro Woche unsere besten Artikel & Videos aus den Bereichen SEO, SEA, Content Marketing, Social Media & Usability zugeschickt. Jetzt anmelden! Über 11.000 E-Mail-Abonnenten vertrauen uns bereits.
Jetzt anfordern
close-image

Send this to a friend

Google Bewertung
5.0
Basierend auf 13 Rezensionen
×