新站為什么要先做收錄?seo公司做新站優(yōu)化有講究
一個網(wǎng)站需要的文章頁面數(shù)量通常不是幾萬,而是數(shù)百萬。如何在短時間內將網(wǎng)站中的文章數(shù)量翻倍或倍增?一種方法是增加內容,第二種方法是提高網(wǎng)站在搜索引擎中的“收錄率”。
1、 添加內容
常用的方法有三種:關鍵字詞庫構建、標簽頁生成、UGC頁生成。
2、 關鍵詞詞庫的構建
通常,在規(guī)劃網(wǎng)站時,頁面是根據(jù)產(chǎn)品的SKU生成的。關鍵詞詞庫的方法是挖掘行業(yè)中所有的常用詞、產(chǎn)品詞、競爭詞和品牌詞,然后根據(jù)這些詞生成網(wǎng)頁。以58城市為例,在網(wǎng)絡建設之初,將區(qū)域細化到縣,按照乘法原理:縣單位×常用詞×小字段分類×大字段分類生成頁面;公眾點評將區(qū)域細化到某一條路或某個pol,所以按照乘法原理,過億的路可以產(chǎn)生上百億的頁面。
淘寶上有上億個關鍵詞詞庫,而返利平臺項目上卻有上億個關鍵詞詞庫。
“資深SEO分析師”挖字并不難。難點在于如何對生成的聚合頁面進行“標記”,使其不被搜索引擎視為“垃圾頁面”,保證頁面的原創(chuàng)性和用戶體驗。
3、 標記頁生成
關鍵詞詞庫建設就是以關鍵詞為核心,快速生成數(shù)以億計的網(wǎng)頁。標簽聚合頁面是以關鍵字索引為核心,快速生成上千萬個標簽頁面。
標簽頁可以理解為主題頁和列表頁,但對于標簽頁的權重,從投票原則來看,標簽頁有多個內頁進行投票,權重應該高于文章頁,這幾乎是所有門戶都做過的。從用戶體驗的角度來看,標簽頁有時遠不如文章頁有價值。不久前,百度嚴厲打擊垃圾網(wǎng)頁,其中標簽網(wǎng)頁是主打。
很多門戶網(wǎng)站,首先是批量收錄垃圾頁面,甚至不復制。它們直接堆積在網(wǎng)站數(shù)據(jù)庫中,然后根據(jù)關鍵字生成標簽頁。盡管文章對于搜索引擎來說是垃圾,但是由文章標題或meta生成的標簽頁對于搜索引擎來說是原始的。雖然搜索引擎對標簽頁的權重越來越低,但具有高相關性和良好用戶體驗的標簽頁仍然具有較高的投票能力。
標簽頁生成的一步是單詞擴展,這與關鍵字詞庫的構建是一樣的。區(qū)別在于你需要制作不同的主題模板,而主頁必須給你一個入口。
以某保險網(wǎng)站為例,首先做一個標簽,即進入頁面。
(1) 支持關鍵字重復數(shù)據(jù)消除功能。將關鍵字導入后臺關鍵字庫時,再次導入該關鍵字是無效的,即新導入的重復關鍵字不生成ID或新頁。
(2) 每次可以批量導入1-5000個關鍵字,并為導入的每個新的非重復關鍵字生成一個單獨的ID
(3) 后臺會提示哪些導入的關鍵字重復,并支持刪除重復關鍵字的功能。
(4) 后臺導入關鍵字后,點擊〖生成頁面〗按鈕,可以在后臺預覽網(wǎng)站數(shù)據(jù)庫中生成的頁面信息。
(5) 背景可以檢測不同關鍵字生成結果頁時的內容重復性。如果多個關鍵字之間有70%以上的內容重復,后臺會有相應的提示,ID重復的關鍵字不會生成頁面和URL。
(6) 后臺需要設置超級管理員和普通用戶的用戶權限級別。普通用戶可以上傳關鍵字并預覽生成的頁面,查詢關鍵字ID信息功能,但他們沒有權限發(fā)布在線關鍵字頁面;超級管理員擁有普通用戶的所有權限,也有權限點擊發(fā)布在線搜索關鍵字。
(7) 導入的關鍵字必須包含兩個中文字符或兩個英文字符才能生成搜索聚合頁。單個漢字或英文字母不支持導入關鍵字庫和生成頁面的限定。
(8) 支持自動或手動向關鍵字生成的聚合頁面添加標簽。這些標記用于以后使用相同的標記調用信息文章、評論、主題和其他聚合頁面。
(9) 支持關鍵字聚合頁面的單次、批量“添加、刪除、修改”功能。
(10) 支持在搜索聚合頁的關鍵字庫中,將關鍵字全部或部分前導的功能。
注:如果你的網(wǎng)站CMS沒有這些功能,這是可以的。你可以根據(jù)這個想法調整和優(yōu)化自己。您也可以查看我們錦繡大地SEO培訓基地的VIP課程,了解如何使用它。
(1) 每頁最多可生成40篇文章,最少可生成10篇文章;不足10篇不生成URL和頁面
(2) 每個生成的關鍵字聚合頁面之間的內容重復性不能大于70%,如果大于70%,則后面導入的關鍵字不會生成URL和頁面。
(3) 每個關鍵字生成的文章標題必須包含多個相同的詞根(詞根字符數(shù)大于或等于2,如果數(shù)據(jù)庫中有中英文分詞詞根)。此時,程序員還需要檢查導入關鍵字后生成的文章結果的質量。
(4) 預生成的關鍵字聚合頁面必須有專人預覽和檢查文章結果的匹配程度;如果生成的結果不夠準確,用戶體驗不好,很容易造成垃圾頁面,導致搜索引擎的功耗降低。
(5) 搜索關鍵詞聚合頁面要求代碼最精煉、最簡化,沒有其他渠道或活動的廣告、JS控件、交互控件和框架內容,轉換和監(jiān)控代碼不超過兩個,追求的打開速度和用戶體驗。
接下來,它必須遵循關鍵詞聚合頁面的規(guī)則,如頁面聚合規(guī)則、標簽規(guī)則、頁面內容板塊對應的邏輯規(guī)則、頭部導航、面包屑、信息頁面規(guī)則、相關主題規(guī)則、URL規(guī)則、標題規(guī)則、元規(guī)則等。關于內容規(guī)則,錦繡大地SEO培訓基地有詳細的介紹視頻介紹。
5、 URL優(yōu)化
URL優(yōu)化收錄很多方面,其中有10個重要方面。根據(jù)重要性,順序如下。
死循環(huán):反映在列表頁a點擊到B,然后從B點擊到a,結果a第二次點擊返回的URL與***次點擊返回的URL完全不同。這是收錄忌諱,因為一旦蜘蛛進入死循環(huán),它總會落入其中,爬不出來。
死鏈接:想象一個蜘蛛從網(wǎng)頁a爬到網(wǎng)頁B,然后爬到網(wǎng)頁C。結果,B不能被打開,所以C不能被收錄在內。另一種情況是,主體已被刪除,但URL仍然存在。這種頁面可以稱為“活鏈接和死鏈接”。用戶體驗很差,建議批量301。
重復頁面:就像兩個豌豆,網(wǎng)址是不同的。
(1)層次:在建立網(wǎng)站時,你喜歡遵循嚴格的邏輯:“首頁-大類首頁-頻道首頁-產(chǎn)品詞首頁-主題頁-文章頁”。一般來說,你可以做6級以上。搜索引擎會根據(jù)每個網(wǎng)站的權重和更新情況給蜘蛛爬行的時間和次數(shù),如果級別太多,蜘蛛爬到第五級時很可能無法爬到第六級,而第六級往往有大量的“干貨”頁面。
因此,許多網(wǎng)站在設置URL時只有兩層結構:主頁和其他頁面(所有頁面都放在二級目錄下)和URL規(guī)則
(2)翻頁規(guī)則:主要用于列表頁。當翻頁超過10000頁時,建議以50>100或更大的間隔來制定底部翻頁規(guī)則。例如,可以將底部規(guī)則設置為“1、2、3、4、5、10、20、30、40、50”,依此類推。當蜘蛛爬到第五頁時,底部顯示變?yōu)椤?,7,8,9,15,25,35,45,55”,這樣蜘蛛可以快速完成所有的翻頁。
蜘蛛陷阱:302跳轉>flash跳轉、flash頁面>Sessionid、強制使用Cookie、需要登錄才能填寫驗證碼等。
(3)不允許/
網(wǎng)站地圖:XML網(wǎng)站地圖,向百度提交的網(wǎng)站地圖
6、 蜘蛛入口
有些網(wǎng)站可以每天更新一定數(shù)量的原創(chuàng)文章。XML網(wǎng)站地圖或服務器日志顯示spider每天出現(xiàn)的時間非常短,或者新的主題頁/文章頁可以在搜索引擎中獲得很好的排名。因此,在主頁上添加條目是不錯的方法。
雖然XML網(wǎng)站地圖會使網(wǎng)頁被收錄,但是收錄和可以在搜索引擎中用站點命令檢索是兩件事,檢索到有排名是另一件事。一個網(wǎng)站,因為所有的頁面都投票給首頁,所以首頁的權重很高,而首頁給出入口,這意味著網(wǎng)站權重的頁面投票給“入口頁面”,入口頁面的權重瞬間增加;
另外,蜘蛛一般會從主頁爬到其他級別的頁面,把主頁爬到入口,這意味著只要蜘蛛訪問網(wǎng)站,入口頁面就會被收錄。
7、 代碼優(yōu)化
蜘蛛到每個網(wǎng)站,在一段時間內,蜘蛛的數(shù)量大致是固定的。
同時,爬一個10000行的網(wǎng)頁相當于爬10個1000行的網(wǎng)頁。所以,從理論上講,如果你有10000行的網(wǎng)頁代碼,你可以把它減少到1000行以下,那么,在同樣的權重下,蜘蛛爬行的網(wǎng)站應該高出10倍。
在上萬個頁面內,代碼優(yōu)化的效果非常慢。對于千千萬萬的網(wǎng)站來說,代碼優(yōu)化的效果,無論是搜索引擎的數(shù)量還是新UV,都會起到難以置信的效果。
蜘蛛訪問網(wǎng)站的時間是有限的。如果蜘蛛需要三到五倍甚至十倍于正常速度的速度來抓取一個頁面,那么它們可以抓取的頁面數(shù)量肯定是有限的。web服務器的問題之一是用戶體驗非常差。對于如今“用戶體驗優(yōu)先”的搜索引擎來說,不僅會受到影響,其排名也會直線下降。
想了解更多SEO技術的內容,請訪問:SEO技術