#Google

Warum Googles „semantische Suche“ ein PR-Desaster war und trotzdem kommt

von , 15.5.12

1) Die Semantik, die sie meinen

Semantische Suche ist gemeinhin ein Oberbegriff für eine Reihe von Methoden und Technologien, die dazu geeignet sind, den Sinngehalt eines Begriffes bei der Zusammenstellung von Suchergebnissen zu berücksichtigen. Somit ist es möglich, sinnverwandte Konzepte zu bündeln und von Konzepten, die lediglich die gleiche Schreibweise haben, abzugrenzen. Ein Jaguar kann ein Tier, eine Automarke, ein Jagdpanzer oder ein Gitarrenhersteller sein. Ebenso kann man auf die Insel Java auf Urlaub fahren oder mit der gleichlautenden Programmiersprache die nächste Killerapplikation fürs Internet bauen.

Mittlerweile sind semantische Systeme so weit fortgeschritten, dass sogenannte „Named Entities“ – von denen Google mehrere hundert Millionen in seinem Index vorrätig hält – nicht nur erkannt, sondern auch sinngemäß kontextualisiert werden können. Kontextualisierung bedeutet, dass Google auf Basis der Eigenschaften von Objekten, die auf ein „Wissensmodell“ (auch Knowledge Graph bzw. Ontologie genannt) übertragen werden, Ähnlichkeiten und Beziehungen automatisch erkennen kann, um z.B. Suchanfragen zu bedienen wie: Welche klassischen Komponisten sind in Wien gestorben? Antwort: Mozart und Beethoven. Oder: Welche Länder haben die höchste Sterberate? Antwort: Fragen Sie Google…

Zusätzlich ist Google in der Lage, relativ komplexe natürlich-sprachliche Konstrukte mit einer hohen Präzision zu analysieren, um beispielsweise die journalistische Berichterstattung nachträglich vollautomatisiert auf Sinnzusammenhänge zu untersuchen, etwa: Wer sagte wann was worüber in welcher Tonalität? Dieses Feld der sogenannten Sentiment Analyse weckt insbesondere im Bereich von Online-Werbung und Social Media Monitoring Begehrlichkeiten, verspricht es doch die subliminale Bedienung und Steuerung von Konsuminteressen und die Verringerung von Streuverlusten.

2) Google ist nicht allein, aber gut vorbereitet

Im Bereich der Computational Semantics spielen neben den sprachanalytischen Methoden auch Metadaten eine wichtige Rolle. Bisher bestand jedoch das Problem, dass eine fehlende Standardisierung von deskriptiven Metadaten in Form von Schemata und Vokabularen deren automatische Verarbeitung massiv erschwerte. Für dieses Problem hält Google eine simple, aber effektive Lösung bereit. Mit dem Open Data Service schema.org betreiben Google, Bing, Yahoo! und Yandex seit 2011 eine umfangreiche Sammlung an Vokabularen und Metadaten-Schemata, die für die Auszeichnung von Objekten verwendet werden können und die von den Bots der großen Suchmaschinenanbieter indiziert werden.

Die Kompetenz der Metadatenbewirtschaftung hat sich Google im Jahr 2010 unter anderem mit dem Unternehmen MetaWeb eingekauft, das mit dem Portal Freebase eine vor allem in den USA häufig genutzte, hoch-strukturierte Alternative zu Wikipedia betreibt. MetaWeb hat sich auf die Verarbeitung von semantischen Metadaten spezialisiert, und dieses Wissen setzt Google seither in zunehmenden Maße zur besseren Strukturierung und Segmentierung seiner Suchergebnisse (Rich Snippets) ein. Dies wird in Zukunft vor allem für den Bereich eCommerce, aber auch für die Suchmaschinen-Optimierung interessant. Die  so genannten Mikroformate bzw. Semantic Metadata werden eine wichtige Rolle bei der personalisierten Darstellung und Qualitätsbeurteilung von Information spielen – und dieser Umstand sorgt unter den Online-Vermarktern für Nervosität.

3) Berechtigte Nervosität oder doch nur PR?

Doch die Meinungen unter den Werbern und Suchmaschinen-Optimierern sind geteilt. So sehen die einen eine semantische Wende am Horizont und prophezeien tiefgreifende Veränderungen für den Suchmaschinen-Werbemarkt.  Im Bereich des Suchmaschinen-Marketings wird das Keyword-Advertising durch das Concept-Advertising ersetzt. Überoptimierte Seiten werden im Ranking abgestraft, während der semantische Abgleich von Werbe-Content mit Page-Content eine höhere Granularität und Treffsicherheit bei der Ansprache von Konsumenten garantiert.

Die anderen fragen wiederum, was an Googles Verlautbarungen grundsätzlich neu sei, ist doch schon seit Jahren bekannt, dass nicht nur Google semantische Technologien zur Qualitätsverbesserung seiner Suchdienste einsetzt – ohne seine Geschäftspraxis zu verändern. Das „Keyword“ wird im Hintergrund schon lange als Konzept behandelt, und hinter dem neu aufkeimenden Hype um „semantische Suche“ vermuten viele eher eine fehlgelaufene PR-Aktion als einen radikalen technologischen Sprung.

Wer immer Recht behalten mag, eines ist mittelfristig absehbar: Die Art des automatisierten Umgangs mit Information wird sich ändern, denn die Verfügbarkeit von hoch-strukturierten semantischen Daten im Web nimmt zu, wie die Beispiele Wikidata, die Linked Data Cloud oder Open Government Data zeigen. Auch ist absehbar, dass diese Daten bewirtschaftet werden wollen und Google dazu seine Pläne bereits in der Schublade hat.

Hier geht der Trend eindeutig von der Dokumentsuche hin zur Faktensuche und Question-Answering-Machine, die vor allem auf mobilen Endgeräten neue Formen der multimodalen Interaktion (Speech to Text et vice versa) ermöglichen wird. Der damit verbundene „Semantic Turn“ wird jedoch nicht disruptiv, sondern inkrementell vonstatten gehen. Und auch wenn sich an der Oberfläche vorerst nichts grundlegend ändert, die Veränderungen unter der Motorhaube sind massiv. Schlechte PR lenkt hiervon nur ab.

P.S.: Eben erst hat der Mediendienst Kress das Thema aufgegriffen und ein Screenshot zu Googles semantischer Suche veröffentlicht.

Zustimmung, Kritik oder Anmerkungen? Kommentare und Diskussionen zu den Beiträgen auf CARTA finden sich auf Twitter und auf Facebook.