HTTP 狀態(tài)代碼以及網(wǎng)絡(luò)連接錯誤和 DNS 錯誤對 Google 搜索有何影響
本文介紹了不同的 HTTP 狀態(tài)代碼、網(wǎng)絡(luò)連接錯誤和 DNS 錯誤對 Google 搜索有何影響。我們在本文中介紹了 Googlebot 在網(wǎng)絡(luò)上最常遇到的 20 個狀態(tài)代碼,以及最突出的網(wǎng)絡(luò)連接錯誤和 DNS 錯誤,但未介紹一些較奇特的狀態(tài)代碼,例如 418 (I'm a teapot)。本文中提及的所有問題都會在 Search Console 的"抓取統(tǒng)計(jì)信息"報告中生成相應(yīng)的錯誤或警告。
除非另有說明,否則受支持協(xié)議(HTTP 和 FTP)的實(shí)驗(yàn)性功能默認(rèn)不受支持。
HTTP 狀態(tài)代碼
HTTP 狀態(tài)代碼是由托管網(wǎng)站的服務(wù)器在對客戶端(如瀏覽器或抓取工具)發(fā)出的請求作出響應(yīng)時生成的。每個 HTTP 狀態(tài)代碼都有不同的含義,但請求結(jié)果往往相同。例如,有多個狀態(tài)代碼會發(fā)出重定向信號,但它們的結(jié)果是相同的。
Search Console 會為 4xx–5xx 范圍內(nèi)的狀態(tài)代碼和失敗的重定向 (3xx) 生成錯誤消息。如果服務(wù)器返回 2xx 狀態(tài)代碼,則響應(yīng)中接收到的內(nèi)容可能會被考慮編入索引。
HTTP 2xx (success) 狀態(tài)代碼并不能保證一定會編入索引。
HTTP 狀態(tài)代碼 | ||
2xx (success) | Google 會考慮將內(nèi)容編入索引。如果內(nèi)容表明有錯誤,例如空網(wǎng)頁或錯誤消息,則 Search Console 會顯示軟 404 錯誤。 | |
200 (success) | Googlebot 會將內(nèi)容傳遞給索引編制流水線。索引編制系統(tǒng)可能會將內(nèi)容編入索引,但不保證一定會。 | |
201 (created) | Googlebot 會等待內(nèi)容一段時間,然后將其接收的任何內(nèi)容傳遞給索引編制流水線。超時時長取決于用戶代理,例如,Googlebot(智能手機(jī)版)的超時時長可能與 Googlebot Image 的不同。 | |
202 (accepted) | ||
204 (no content) | Googlebot 會向索引編制流水線發(fā)出信號,指示它未收到任何內(nèi)容。Search Console 可能會在網(wǎng)站的"索引涵蓋范圍"報告中顯示軟 404 錯誤。 | |
3xx (redirects) | Googlebot 會跟蹤最多 10 次重定向。如果抓取工具在 10 次重定向內(nèi)沒有收到內(nèi)容,則 Search Console 會在網(wǎng)站的"索引涵蓋范圍"報告中顯示重定向錯誤。Googlebot 跟蹤的重定向次數(shù)取決于用戶代理;例如,Googlebot(智能手機(jī)版)的重定向次數(shù)值可能不同于 Googlebot Image。 對于 robots.txt,Google 會按照 RFC 1945 的規(guī)定跟蹤至少五次重定向,然后便會停止,并將其作為 robots.txt 文件的 404 錯誤處理。 | |
301 (moved permanently) | Googlebot 會跟蹤重定向,并且索引編制流水線會將該重定向用作指示重定向目標(biāo)應(yīng)是規(guī)范網(wǎng)址的強(qiáng)信號。 | |
302 (found) | Googlebot 會跟蹤重定向,并且索引編制流水線會將該重定向用作指示重定向目標(biāo)應(yīng)是規(guī)范網(wǎng)址的弱信號。 | |
303 (see other) |
Googlebot 會向索引編制流水線發(fā)出信號,指示內(nèi)容與上次抓取的內(nèi)容相同。索引編制流水線可能會重新計(jì)算網(wǎng)址的信號,除此之外,此狀態(tài)代碼對索引編制沒有任何影響。
|
|
304 (not modified) | ||
307 (temporary redirect) | 等同于 302。 | |
308 (moved permanently) | 等同于 301。 | |
雖然 Google 搜索會以相同的方式處理這些狀態(tài)代碼,但請注意,它們在語義上是不同的。請使用適合重定向的狀態(tài)代碼,以便其他客戶端(例如電子閱讀器、其他搜索引擎)可以從中受益。 | ||
4xx (client errors) | Google 的索引編制流水線不會考慮將返回 4xx 狀態(tài)代碼的網(wǎng)址編入索引,而已編入索引且返回 4xx 狀態(tài)代碼的網(wǎng)址會從索引中移除。 | |
400 (bad request) | 系統(tǒng)對 429 之外的所有 4xx 錯誤都采用同一種處理方式:Googlebot 向索引編制流水線發(fā)出信號,指示內(nèi)容不存在。 索引編制流水線會將之前已編入索引的網(wǎng)址從索引中移除。 系統(tǒng)不會處理新遇到的 404 網(wǎng)頁。抓取頻率會逐漸降低。 請勿使用 401 和 403 狀態(tài)代碼限制抓取速度。4xx 狀態(tài)代碼(429 除外)對抓取速度沒有影響。 了解如何限制抓取速度。 | |
401 (unauthorized) | ||
403 (forbidden) | ||
404 (not found) | ||
410 (gone) | ||
411 (length required) | ||
429 (too many requests) | Googlebot 會將 429 狀態(tài)代碼視為服務(wù)器過載的信號,這被視為服務(wù)器錯誤。 | |
5xx (server errors) | 5xx 和 429 服務(wù)器錯誤會提示 Google 抓取工具暫時減慢抓取速度。已編入索引的網(wǎng)址仍會保留在索引中,但最終會被丟棄。 如果 robots.txt 文件返回服務(wù)器錯誤狀態(tài)代碼的時間超過 30 天,Google 會使用 robots.txt 的最后一個緩存副本。如果沒有緩存副本,Google 會假定沒有任何抓取限制。 | |
500 (internal server error) | Googlebot 會降低網(wǎng)站的抓取速度。抓取速度下降幅度與返回服務(wù)器錯誤的具體網(wǎng)址數(shù)量成比例。 Google 的索引編制流水線會從索引網(wǎng)址中移除始終返回服務(wù)器錯誤的網(wǎng)址。 | |
502 (bad gateway) | ||
503 (service unavailable) |
網(wǎng)絡(luò)連接錯誤和 DNS 錯誤
網(wǎng)絡(luò)連接錯誤和 DNS 錯誤會對網(wǎng)址在 Google 搜索中的顯示情況迅速產(chǎn)生負(fù)面影響。 Googlebot 處理網(wǎng)絡(luò)超時、連接重置和 DNS 錯誤的方式與處理 5xx 服務(wù)器錯誤的方式類似。如果發(fā)生網(wǎng)絡(luò)連接錯誤,抓取速度會立即開始減慢,因?yàn)榫W(wǎng)絡(luò)連接錯誤表明服務(wù)器可能無法處理服務(wù)負(fù)載。系統(tǒng)會在幾天內(nèi)從 Google 索引中移除無法訪問的已編入索引網(wǎng)址。Search Console 可能會針對每個相應(yīng)的錯誤生成錯誤。
如果您不是自行托管自己的網(wǎng)站,請向托管服務(wù)提供商或 CDN 提供商尋求幫助。
調(diào)試網(wǎng)絡(luò)連接錯誤
這些錯誤會在 Google 開始抓取網(wǎng)址前或在 Google 抓取網(wǎng)址期間發(fā)生。 由于錯誤可能會在服務(wù)器能響應(yīng)之前發(fā)生,因此沒有可提示問題的狀態(tài)代碼,診斷這些錯誤可能難度更大。如需調(diào)試超時和連接重置錯誤,請執(zhí)行以下操作:
1、查看防火墻設(shè)置和日志??赡艽嬖谶^于寬泛的屏蔽規(guī)則集。確保 Googlebot IP 地址未被任何防火墻規(guī)則屏蔽。
2、查看網(wǎng)絡(luò)流量。使用 tCPDump 和 Wireshark 之類的工具捕獲和分析 TCP 數(shù)據(jù)包,并查找指向特定網(wǎng)絡(luò)組件或服務(wù)器模塊的異常。
3、如果找不到任何可疑情況,請與您的托管公司聯(lián)系。
錯誤可能發(fā)生在負(fù)責(zé)處理網(wǎng)絡(luò)流量的任何服務(wù)器組件中。例如,過載的網(wǎng)絡(luò)接口可能會丟棄導(dǎo)致超時(無法建立連接)的數(shù)據(jù)包并重置連接(由于端口被錯誤地關(guān)閉而發(fā)送 RST 數(shù)據(jù)包)。
調(diào)試 DNS 錯誤
1、導(dǎo)致 DNS 錯誤最常見的原因是配置錯誤,但也可能是由于防火墻規(guī)則阻止了 Googlebot DNS 查詢。如需調(diào)試 DNS 錯誤,請執(zhí)行以下操作:
2、檢查防火墻規(guī)則。確保沒有任何 Google IP 被防火墻規(guī)則屏蔽,并且允許 UDP 和 TCP 請求。
3、查看 DNS 記錄。請仔細(xì)檢查您的 A 和 CNAME 記錄是否分別指向正確的 IP 地址和主機(jī)名。例如:
dig +nocmd example.com a +noall +answer
dig +nocmd www.example.com cname +noall +answer
4、請檢查您的所有域名服務(wù)器是否指向您網(wǎng)站的正確 IP 地址。例如:
dig +nocmd example.com ns +noall +answerexample.com. 86400 IN NS a.iana-servers.net.example.com. 86400 IN NS b.iana-servers.net.dig +nocmd @a.iana-servers.net example.com +noall +answerexample.com. 86400 IN A 93.184.216.34dig +nocmd @b.iana-servers.net example.com +noall +answer...
5、如果您在過去 72 小時內(nèi)更改了 DNS 配置,則可能需要等待更改傳播到全球 DNS 網(wǎng)絡(luò)。
如需加快傳播速度,您可以刷新 Google 的公開 DNS 緩存。
6、如果您運(yùn)行的是自己的 DNS 服務(wù)器,請確保它運(yùn)行狀況良好,并且沒有過載。
想了解更多SEO資料的內(nèi)容,請?jiān)L問:SEO資料