使用 noindex 阻止搜索引擎編入索引
可以通過在 HTTP 響應中包含 noindex 元標記或標頭,阻止網頁或其他資源顯示在 Google 搜索中。當 Googlebot 下次抓取該網頁并發(fā)現(xiàn)該標記或標頭時,就會完全阻止該網頁出現(xiàn)在 Google 搜索結果中,不論是否有其他網站鏈接到該網頁。
重要提示:為讓 noindex 指令生效,網頁或資源不得被 robots.txt 文件屏蔽,并且必須能被抓取工具訪問。如果該網頁被 robots.txt 文件屏蔽或抓取工具無法訪問該網頁,那么抓取工具將永遠無法看到 noindex 指令,因此該網頁可能仍會顯示在搜索結果中,例如,如果有其他網頁鏈接到該網頁的情況。
如果您不具備對服務器的根訪問權限,可借助非常實用的 noindex 控制對您網站中各個網頁的訪問權限。
實施 noindex
實施 noindex 的方法有兩種:將其作為元標記實施,或作為 HTTP 響應標頭實施。這兩種方法的效果相同,從中選擇更方便您網站采用并且更適合相應內容類型的那一種方法即可。
<meta> 標記
若想阻止大部分搜索引擎網頁抓取工具將您網站中的某個網頁編入索引,請將以下元標記放入該網頁的 <head> 部分中:
<meta name="robots" content="noindex">
若想僅阻止 Google 網頁抓取工具將網頁編入索引,請使用以下元標記:
<meta name="googlebot" content="noindex">
請注意,某些搜索引擎網頁抓取工具對 noindex 指令可能會有不同的解讀。因此,您的網頁可能仍會出現(xiàn)在其他搜索引擎的結果中。
詳細了解 noindex 元標記。
HTTP 響應標頭
除了使用元標記,您還可在響應中返回一個值為 noindex 或 none 的 X-Robots-Tag 標頭。響應標頭可用于非 Html 資源,例如 PDF、視頻文件和圖片文件。下面是一個 HTTP 響應示例,它含有一個 X-Robots-Tag,用來指示抓取工具不要將某一網頁編入索引:
HTTP/1.1 200 OK
(…)
X-Robots-Tag: noindex
(…)
詳細了解 noindex 響應標頭。
幫助我們發(fā)現(xiàn)您的元標記
我們必須抓取您的網頁,才能看到元標記和 HTTP 標頭。如果某個網頁仍顯示在搜索結果中,可能是因為在您添加標記后我們尚未抓取過該網頁。您可以使用網址檢查工具請求 Google 重新抓取您的網頁。此外,也可能是因為 robots.txt 文件阻止 Google 網頁抓取工具訪問該網址,因此這些抓取工具無法發(fā)現(xiàn)此標記。若要允許 Google 訪問您的網頁,您必須修改 robots.txt 文件。您可以使用 robots.txt 測試工具修改和測試 robots.txt。
想了解更多SEO資料的內容,請訪問:SEO資料