Dieser Inhalt wurde automatisch aus dem Englischen übersetzt, und kann Fehler enthalten. Erfahre mehr über dieses Experiment.

View in English Always switch to English

<meta name="robots"> HTML-Attributwert

Der robots-Wert für das name Attribut des <meta> Elements (oft als "robots tag" bezeichnet) definiert das Crawl- und Indexierungsverhalten, das Web-Crawler auf der Seite verwenden sollten. Wenn angegeben, definieren Sie Anweisungen für Crawler im content Attribut des <meta> Elements als eine durch Kommas getrennte Liste von einer oder mehreren Regeln.

Zum Beispiel kann ein noindex Wert verwendet werden, um Crawler darauf hinzuweisen, dass eine Seite von ihren Suchindizes ausgeschlossen werden sollte:

html
<meta name="robots" content="noindex" />

Hinweis: Nur kooperative Roboter befolgen diese Regeln. Ein Crawler muss trotzdem auf die Ressource zugreifen, um Header und Meta-Elemente zu lesen (siehe X-Robots-Tag: Interaktion mit robots.txt). Wenn Sie den Bandbreitenverbrauch durch Crawler verhindern möchten, ist eine restriktive robots.txt Datei effektiver als Indexierungsregeln, da sie den Zugriff auf Ressourcen vollständig blockiert.

Nutzungshinweise

Ein <meta name="robots"> Element kann die folgenden zusätzlichen Attribute haben:

content

Das content Attribut muss definiert sein, und sein Wert legt das Indexierungs- und Crawl-Verhalten für kooperative Suchmaschinenroboter fest. Es akzeptiert einen oder mehrere der folgenden Schlüsselwörter als durch Kommas getrennte Liste:

index

Erlaubt dem Roboter, die Seite zu indexieren. Dies ist das Standardverhalten. Wird von allen großen Crawlern verwendet.

noindex

Fordert den Roboter auf, die Seite nicht zu indexieren. Wird von allen großen Crawlern verwendet.

follow

Erlaubt dem Roboter, Links auf der Seite zu folgen. Dies ist das Standardverhalten. Wird von allen großen Crawlern verwendet.

nofollow

Fordert den Roboter auf, die Links auf der Seite nicht zu verfolgen. Wird von allen großen Crawlern verwendet.

all

Entspricht index, follow. Verwendet von: Google.

none

Entspricht noindex, nofollow. Verwendet von: Google.

noarchive

Fordert, dass die Suchmaschine den Seiteninhalt nicht im Cache speichert. Verwendet von: Google, Yahoo, Bing.

nosnippet

Verhindert die Anzeige einer Beschreibung der Seite in Suchmaschinenergebnissen. Verwendet von: Google, Bing.

noimageindex

Fordert, dass diese Seite nicht als verweisende Seite eines indizierten Bildes erscheint. Verwendet von: Google.

nocache

Synonym für noarchive. Verwendet von: Bing.

Beschreibung

Es gibt mehrere wichtige Überlegungen, die beim Festlegen eines robots Meta-Wertes zu beachten sind:

  • Nur kooperative Roboter befolgen diese Regeln. Sie verhindern nicht, dass böswillige Akteure wie E-Mail-Sammler die Direktiven ignorieren.
  • Wenn sie in einem <meta> Tag definiert sind, müssen Roboter dennoch auf die Seite zugreifen, um diese Regeln zu lesen. Um Bandbreitenverbrauch zu reduzieren, sollten Sie überlegen, stattdessen eine robots.txt Datei zu verwenden.
  • Der <meta name="robots"> Tag und die robots.txt dienen unterschiedlichen Zwecken: robots.txt steuert das Crawlen, während der robots Meta-Tag das Indexieren und andere Verhaltensweisen beeinflusst.
  • Eine durch robots.txt blockierte Seite kann immer noch indiziert werden, wenn sie von anderen Quellen verlinkt wird.
  • Die noindex Direktive wird erst wirksam, nachdem der Roboter die Seite erneut besucht hat, stellen Sie also sicher, dass robots.txt dies nicht verhindert.
  • Einige Werte, wie index vs. noindex oder follow vs. nofollow, schließen sich gegenseitig aus. Das Verhalten ist undefiniert, wenn widersprüchliche Werte verwendet werden.
  • Roboter wie Google, Yahoo und Bing unterstützen diese Direktiven auch im HTTP-Header X-Robots-Tag, was für nicht-HTML-Inhalte wie PDFs oder Bilder nützlich ist.

Beispiele

Verwendung eines robots-Schlüsselwortes

Das folgende Beispiel verwendet nofollow, um einen Crawler aufzufordern, keine Links auf einer Seite zu verfolgen, und noindex, um zu verlangen, dass die Seite aus dem Index ausgeschlossen wird:

html
<meta name="robots" content="nofollow, noindex" />

Spezifikationen

Obwohl es nicht Teil einer Spezifikation ist, ist es eine de-facto Standardmethode, um mit Suchbots, Web-Crawlern und ähnlichen Benutzeragenten zu kommunizieren.

Browser-Kompatibilität

Dieses Feature ist für Crawler gedacht, daher ist "Browser"-Kompatibilität nicht anwendbar.

Siehe auch