Wolfgang Michal | 8 Kommentar(e)
Mit der einfachen Anweisung robots.txt (dem Robots Exclusion Standard) könnten wohlschmeckende Medieninhalte vor gierigen Suchmaschinen versteckt werden. Doch die Verleger nutzen das Programm nicht. Sie wollen ACAP. ACAP ist eine intelligente Version von robots.txt – intelligent im Sinne der Verlage.
02.12.2009 |
Automated Content Access Protocol (ACAP) ist ein Programm, mit dessen Hilfe Webseiten-Betreiber (z.B. Verleger) Kontrolle darüber erlangen, wie Suchmaschinen auf Inhalte zugreifen dürfen. ACAP ist Digitales Rechte-Management (DRM).
Während das Protokoll robots.txt vor allem festlegt, welche Datei von den Robotern erfasst werden darf und welche nicht, kann das ACAP-Programm viel mehr. Es kann festlegen:
- wann ein Inhalt aus dem Suchmaschinenindex wieder zu entfernen ist,
- ob der komplette Inhalt erfasst werden darf oder nur einzelne Abschnitte daraus,
- ob Inhalte in pdfs umgewandelt werden dürfen oder nicht,
- ob das Layout verändert werden darf oder nicht,
- welche Inhalte auf jeden Fall indexiert werden müssen,
- welche Links auf einer Seite für Suchmaschinen tabu sind,
- wie viele Zeichen der Text eines Suchmaschinentreffers (eines Snippets) maximal umfassen darf,
- was eine Suchmaschine für die Indexierung bezahlen muss.
Solche Anweisungen könnten z.B. so aussehen:
- ACAP-allow-index: /public
- ACAP-allow-present-snippet: /news max-length=250-chars
Oder so:
- Disallow: /ssl/
- Disallow: /skinimages/
- Disallow: /scripts/
- Disallow: /private/
- Disallow: /Files/
- Disallow: /CMS/
Das ACAP-Protokoll wurde einst auf Initiative des Weltverbandes der Zeitungen (WAN) entwickelt und im November 2007 in einer ersten Version der Öffentlichkeit vorgestellt. ACAP ist einfach, und es ist kostenlos. Seine Anweisungen können (angeblich) direkt in die robots.txt-Datei eingebaut werden.
Aber wenn das so einfach ist, wo ist dann der Haken? Weshalb schlagen sich die Verlage mit Leistungsschutzrechten und Paid Content-Modellen herum, wenn die Lösung ihrer Probleme bereits existiert?
Der Haken ist der: Mit ACAP wären die Suchmaschinen von den Verlagen abhängig (und nicht umgekehrt). Und deshalb wollen die Suchmaschinen ACAP nicht akzeptieren: Zum einen, sagen sie, seien die technischen Anforderungen an die Suchroboter zu komplex. Zum anderen würde das Netz unter komplexen Filterprogrammen leiden. Google-Chef Eric Schmidt formuliert seine Ablehnung so höflich wie kryptisch: “ACAP ist ein Standard von einigen Leuten, die das Problem (der Vermittlung von Zugangsberechtigungen für Inhalte) zu lösen versuchen. Auch bei uns arbeiten einige Mitarbeiter mit ihnen zusammen, um zu sehen, ob die Arbeitsweise unserer Suchmaschine so verändert werden kann, dass sie mit dem Vorschlag zurechtkommt. Zum gegenwärtigen Zeitpunkt verträgt er sich nicht mit der Art und Weise, wie unsere Systeme operieren.”
Was sich da „nicht verträgt“, geht schlicht ans Eingemachte. Die Verlage möchten nämlich nicht nur durchsetzen, dass ihre „teuren“ Inhalte von Suchmaschinen bevorzugt werden. Sie wollen mit ACAP den Schalthebel in die Hand bekommen, der Suchmaschinen im Sinne der Verlage lenkt und kontrolliert. Denn ACAP ist ein ideales Instrument zur Vergabe von Nutzungsrechten. Ja, es könnte in Zukunft sogar als Erlös- und Abrechnungsmodell dienen (siehe dazu Christoph Keeses Vorschlag hier auf Carta).
Allerdings gibt es noch eine entscheidende Hürde: Die Suchmaschinen müssten mitspielen. Bislang kann man sie nicht zur Übernahme des ACAP-Protokolls zwingen. Doch der Druck wächst. Nicht nur von Seiten der Verlage (die ihre Medien für diesen Zweck hemmungslos instrumentalisieren), sondern auch von Seiten der EU-Kommission, der nationalen Regierungen und der Kartellbehörden.
Im Frühjahr 2009 lenkte Google erstmals ein und bezeichnete sich überraschend als großen „Freund der Verlage“. Ein Indiz für eine Annäherung? Zumindest haben die deutschen Verleger davon Abstand genommen, Google auf ähnliche Weise zu verklagen wie die Verbands-Kollegen in Belgien. (Die belgische Copiepress hatte gegen Google zwar gewonnen, aber um welchen Preis? Der Schadensersatz deckte kaum die Kosten der Auseinandersetzung.) Umgekehrt ist Google seit neuestem bereit, den Verlagen irgendwie entgegen zu kommen.
Gibt es einen Waffenstillstand? Stehen die Verlage mit ACAP vor einem Durchbruch oder sind sie – im Gegenteil – an einem toten Punkt angelangt? Lassen sie ACAP sausen und verlegen sich ganz auf den politischen Kampf für ein staatlich garantiertes Leistungsschutzrecht? Die Medienszene rätselt.
Aber man sollte sich nicht täuschen. Die Presseverlage kämpfen heute an vielen Fronten:
- ACAP (= Geschäftsmodell)
- Leistungsschutzrecht (= legislative Flankierung)
- Anti-Piraterieabkommen ACTA (= exekutive Flankierung)
Und die Verlage sind wild entschlossen, an einer dieser Fronten möglichst bald einen Durchbruch zu erzielen.





“Im Frühjahr 2009 lenkte Google erstmals ein und bezeichnete sich überraschend als großen „Freund der Verlage“.”
Überraschend? Der Antagonismus wurde von Verlagsvertretern in die Welt gesetzt, weil sie einen schwarzen Peter brauchten, um ihre Innovationsunfähigkeit zu kaschieren.
Google war schon immer Freund der Verlage (siehe auch Danny Sullivans Artikel über die unerwiderte Liebe von Google den Verlagen gegenüber von irgendwann diesem Jahr). Google betreibt seit Jahren ein kostenloses Portal ohne Einnahmen, dass anfangs einzig den Verlagen Traffic zuspielte. Wer da keine freundliche Verbundenheit sieht, hat dafür politische Gründe. Faktisch aber ergab die unterstellte Feindseligkeit nie Sinn.
[...] Michal beschäftigt sich auf Carta mit dem Automated Content Access Protocol (ACAP), der “intelligenten” Version von [...]
Wie Du schon richtig sagst, die Verlage hätten das gern. Dass sie sich durchsetzen, ist mehr als zweifelhaft. S. dazu auch Bill Rosenblatts Kommentar: “The problem with ACAP is, and has been, that while it benefits publishers, there is little in it for the search engines. If everyone were to implement ACAP, the search engines would get additional content to index that amounts to a minute, minuscule increment to the oceans of content that they already index — and a somewhat less minute incremental amount of monetizable traffic, on the theory that name-brand news content is more popular than average.” (http://copyrightandtechnology.com/2009/11/24/microsofts-search-indexing-bribe-to-news-corp/). Interessanter sind da APs Pläne für eine News Registry: http://copyrightandtechnology.com/2009/07/27/ap-pushes-ahead-with-rights-microformat/
@Marcel/Matthias: Es könnte natürlich sein, dass Google noch stärker unter Druck gerät (rechtlich + politisch). Und dass es dann doch “technische Lösungen” gibt.
Wenn ich eine Suchmaschine wäre und man mich zwingen würde, ACAP zu benutzen, würde ich einfach Treffer aus ACAP-geschützten Seiten beim Ranking niedriger bewerten.
[...] kann, und zwar wesentlich genauer als mit der guten, alten robots.txt. Ars Technica und Carta haben lesenswerte Artikel über die Versuche der großen Zeitungsverlage, diesen Standard [...]
Egal, ob Mikroformate wie hNews oder ACAP: Es wird wohl darauf hinaus laufen, dass gesetzliche Regelungen die Suchmaschinenbetreiber dazu verpflichten, die im Programmierungscode der Webseiten versteckten Nutzungsbedingungen (ob man die als Fingerabdruck, Wasserzeichen oder semantische Annotation bezeichnet, ist letztlich wurscht) zu beachten.
http://mikroformate.de/grundlagen/s5/
[...] Verlage contra Google: Der vergessene Kampf um ACAP — CARTA – 02.12.2009 "Mit der einfachen Anweisung robots.txt (dem Robots Exclusion Standard) könnten wohlschmeckende Medieninhalte vor gierigen Suchmaschinen versteckt werden. Doch die Verleger nutzen das Programm nicht. Sie wollen ACAP. ACAP ist eine intelligente Version von robots.txt – intelligent im Sinne der Verlage." [...]