垃圾信息404處理
今天為什么要說一下404問題呢,最近看case過程中發(fā)現(xiàn)個(gè)很有意思的網(wǎng)站,該網(wǎng)站被灌了大量的垃圾信息,被其發(fā)現(xiàn)后及時(shí)地進(jìn)行了刪除,這一點(diǎn)是值得肯定的。通常情況下,正常網(wǎng)站將自動(dòng)返回404狀態(tài)碼,搜索引擎進(jìn)行更新并刪除,避免對(duì)網(wǎng)站用戶及搜索引擎帶來負(fù)面影響。但問題來了,該網(wǎng)站只刪除了內(nèi)容,沒有任何主體內(nèi)容的頁面被保存了下來,未做404處理。當(dāng)然,存在一類網(wǎng)站只刪除內(nèi)容后返回正常200狀態(tài)碼,提醒一句"該內(nèi)容已刪除",但其都沒有。可以發(fā)現(xiàn)目前這個(gè)搜藏中的url仍然正常返回200,造成的后果:搜索引擎將花費(fèi)大量的資源在這種無效頁面上,那么,同等耗損下用在重要頁面上的資源將被大量擠占,可想而知,正常優(yōu)質(zhì)頁面在搜索引擎的部分表現(xiàn)將受到影響。經(jīng)過我們運(yùn)營同學(xué)的多方溝通下至今仍未進(jìn)一步處理。
404狀態(tài)碼代表'Not Found',spider更新時(shí)會(huì)認(rèn)為該頁面已失效,此時(shí)呢將在索引庫中刪除,短期內(nèi)spider再次發(fā)現(xiàn)該url不再會(huì)抓取。因此,出來了兩類問題:第一,網(wǎng)頁臨時(shí)性打不開;第二,頁面永遠(yuǎn)無法打開。針對(duì)第一類問題,建議不要立刻返回404,而是使用503。503等同于告訴spider該頁面臨時(shí)訪問不了,過段時(shí)間再來光臨。關(guān)于503,spider會(huì)認(rèn)為該網(wǎng)頁臨時(shí)無法訪問,短期內(nèi)會(huì)再光臨。如果網(wǎng)頁已經(jīng)恢復(fù),即刻正常抓取;如果繼續(xù)返回503,短期內(nèi)還會(huì)再光臨幾次,但如果該頁面長時(shí)間返回503,該url仍會(huì)被認(rèn)作失效鏈接,從索引庫中刪除。針對(duì)第二類問題,永遠(yuǎn)無法打開的頁面,404,不用考慮。各種web2類頁面刪除后同樣需要返回404告知搜索引擎該頁面已失效。
回歸之前那個(gè)網(wǎng)站,刪除內(nèi)容后該頁面沒有任何價(jià)值。最恰當(dāng)?shù)奶幚硎牵?/p>
1、直接做死鏈處理并返回404;
2、在百度站長平臺(tái)死鏈提交工具中提交死鏈sitemap。
最后呢,提醒一下各位站長朋友,當(dāng)您的網(wǎng)站存在被發(fā)布大量垃圾信息時(shí),請(qǐng):
1、及時(shí)刪除相關(guān)垃圾頁面,并做404處理;
2、制作符合要求的死鏈sitemap;
3、登錄百度站長平臺(tái),進(jìn)入死鏈提交工具提交死鏈sitemap。
想了解更多SEO新聞的內(nèi)容,請(qǐng)?jiān)L問:SEO新聞