<meta name="robots"> HTML-Attributwert
Der robots-Wert für das name Attribut des <meta> Elements (oft als "robots tag" bezeichnet) definiert das Crawl- und Indexierungsverhalten, das Web-Crawler auf der Seite verwenden sollten.
Wenn angegeben, definieren Sie Anweisungen für Crawler im content Attribut des <meta> Elements als eine durch Kommas getrennte Liste von einer oder mehreren Regeln.
Zum Beispiel kann ein noindex Wert verwendet werden, um Crawler darauf hinzuweisen, dass eine Seite von ihren Suchindizes ausgeschlossen werden sollte:
<meta name="robots" content="noindex" />
Hinweis: Nur kooperative Roboter befolgen diese Regeln. Ein Crawler muss trotzdem auf die Ressource zugreifen, um Header und Meta-Elemente zu lesen (siehe X-Robots-Tag: Interaktion mit robots.txt). Wenn Sie den Bandbreitenverbrauch durch Crawler verhindern möchten, ist eine restriktive robots.txt Datei effektiver als Indexierungsregeln, da sie den Zugriff auf Ressourcen vollständig blockiert.
Nutzungshinweise
Ein <meta name="robots"> Element kann die folgenden zusätzlichen Attribute haben:
content-
Das
contentAttribut muss definiert sein, und sein Wert legt das Indexierungs- und Crawl-Verhalten für kooperative Suchmaschinenroboter fest. Es akzeptiert einen oder mehrere der folgenden Schlüsselwörter als durch Kommas getrennte Liste:index-
Erlaubt dem Roboter, die Seite zu indexieren. Dies ist das Standardverhalten. Wird von allen großen Crawlern verwendet.
noindex-
Fordert den Roboter auf, die Seite nicht zu indexieren. Wird von allen großen Crawlern verwendet.
follow-
Erlaubt dem Roboter, Links auf der Seite zu folgen. Dies ist das Standardverhalten. Wird von allen großen Crawlern verwendet.
nofollow-
Fordert den Roboter auf, die Links auf der Seite nicht zu verfolgen. Wird von allen großen Crawlern verwendet.
all-
Entspricht
index, follow. Verwendet von: Google. none-
Entspricht
noindex, nofollow. Verwendet von: Google. noarchive-
Fordert, dass die Suchmaschine den Seiteninhalt nicht im Cache speichert. Verwendet von: Google, Yahoo, Bing.
nosnippet-
Verhindert die Anzeige einer Beschreibung der Seite in Suchmaschinenergebnissen. Verwendet von: Google, Bing.
noimageindex-
Fordert, dass diese Seite nicht als verweisende Seite eines indizierten Bildes erscheint. Verwendet von: Google.
nocache-
Synonym für
noarchive. Verwendet von: Bing.
Beschreibung
Es gibt mehrere wichtige Überlegungen, die beim Festlegen eines robots Meta-Wertes zu beachten sind:
- Nur kooperative Roboter befolgen diese Regeln. Sie verhindern nicht, dass böswillige Akteure wie E-Mail-Sammler die Direktiven ignorieren.
- Wenn sie in einem
<meta>Tag definiert sind, müssen Roboter dennoch auf die Seite zugreifen, um diese Regeln zu lesen. Um Bandbreitenverbrauch zu reduzieren, sollten Sie überlegen, stattdessen eine robots.txt Datei zu verwenden. - Der
<meta name="robots">Tag und dierobots.txtdienen unterschiedlichen Zwecken:robots.txtsteuert das Crawlen, während derrobotsMeta-Tag das Indexieren und andere Verhaltensweisen beeinflusst. - Eine durch
robots.txtblockierte Seite kann immer noch indiziert werden, wenn sie von anderen Quellen verlinkt wird. - Die
noindexDirektive wird erst wirksam, nachdem der Roboter die Seite erneut besucht hat, stellen Sie also sicher, dassrobots.txtdies nicht verhindert. - Einige Werte, wie
indexvs.noindexoderfollowvs.nofollow, schließen sich gegenseitig aus. Das Verhalten ist undefiniert, wenn widersprüchliche Werte verwendet werden. - Roboter wie Google, Yahoo und Bing unterstützen diese Direktiven auch im HTTP-Header
X-Robots-Tag, was für nicht-HTML-Inhalte wie PDFs oder Bilder nützlich ist.
Beispiele
>Verwendung eines robots-Schlüsselwortes
Das folgende Beispiel verwendet nofollow, um einen Crawler aufzufordern, keine Links auf einer Seite zu verfolgen, und noindex, um zu verlangen, dass die Seite aus dem Index ausgeschlossen wird:
<meta name="robots" content="nofollow, noindex" />
Spezifikationen
Obwohl es nicht Teil einer Spezifikation ist, ist es eine de-facto Standardmethode, um mit Suchbots, Web-Crawlern und ähnlichen Benutzeragenten zu kommunizieren.
Browser-Kompatibilität
Dieses Feature ist für Crawler gedacht, daher ist "Browser"-Kompatibilität nicht anwendbar.
Siehe auch
X-Robots-TagHTTP-Header- robots.txt Konfiguration Leitfaden
- robots.txt Glossareintrag
- Suchmaschine Glossareintrag
- RFC 9309: Robots Exclusion Protocol
- WHATWG Wiki MetaExtensions Seite
- Verwendung des robots Meta-Tags auf developers.google.com