谷歌搜索引擎優(yōu)化 (SEO)網(wǎng)站地圖優(yōu)化詳解
站點(diǎn)地圖是一種文件,您可以在其中提供與您網(wǎng)站中的網(wǎng)頁、視頻或其他文件有關(guān)的信息,還可以說明這些內(nèi)容之間的關(guān)系。Google 等搜索引擎會(huì)讀取此文件,以便更高效地抓取您的網(wǎng)站。站點(diǎn)地圖會(huì)告訴 Google 您認(rèn)為網(wǎng)站中的哪些網(wǎng)頁和文件比較重要,還會(huì)提供與這些文件有關(guān)的重要信息。例如,網(wǎng)頁上次更新的時(shí)間和網(wǎng)頁是否有任何備用的語言版本。
1、確定要使用的站點(diǎn)地圖格式。
2、自動(dòng)或手動(dòng)創(chuàng)建站點(diǎn)地圖。
3、將站點(diǎn)地圖提供給 Google,方法有兩種:將其添加到 robots.txt 文件中,或者將其直接提交給 Search Console。
站點(diǎn)地圖格式
Google 支持多種站點(diǎn)地圖格式:
● XML
● RSS、mRSS 和 Atom 1.0
● 文本
Google 支持所有格式的標(biāo)準(zhǔn)站點(diǎn)地圖協(xié)議,但目前不支持在站點(diǎn)地圖中使用 <priority> 屬性。
無論采用哪種格式,單個(gè)站點(diǎn)地圖的文件大小一律不得超過 50MB(未壓縮),并且其中包含的網(wǎng)址數(shù)量不得超過 50000 個(gè),否則必須將站點(diǎn)地圖拆分成多個(gè)較小的站點(diǎn)地圖。您也可以選擇創(chuàng)建站點(diǎn)地圖索引文件(即指向站點(diǎn)地圖列表的文件),然后將這個(gè)索引文件提交給 Google。您可以向 Google 提交多個(gè)站點(diǎn)地圖和/或站點(diǎn)地圖索引文件。
XML
下方是一個(gè)非?;镜?XML 站點(diǎn)地圖,其中僅包含 1 個(gè)網(wǎng)址的位置信息:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/foo.Html</loc>
<lastmod>2018-06-04</lastmod>
</url>
</urlset>
您可以在 sitemaps.org 上找到更復(fù)雜的示例和完整文檔。
您可以查看指定其他語言版本網(wǎng)頁的站點(diǎn)地圖示例,以及新聞、圖片或視頻文件的站點(diǎn)地圖示例。
RSS、mRSS 和 Atom 1.0
如果您的博客有 RSS 或 Atom Feed,那么您可以將該 Feed 的網(wǎng)址作為站點(diǎn)地圖提交。 大多數(shù)博客軟件都能為您創(chuàng)建 Feed,但請(qǐng)注意,此類 Feed 只會(huì)提供關(guān)于近期網(wǎng)址的信息。
Google 支持 RSS 2.0 Feed 和 Atom 1.0 Feed。
您可以使用 mRSS(媒體 RSS)Feed 向 Google 提供有關(guān)您網(wǎng)站上視頻內(nèi)容的詳情。
文本
如果您的站點(diǎn)地圖只包含網(wǎng)頁網(wǎng)址,那么您可以向 Google 提供簡(jiǎn)單的文本文件(每行只包含一個(gè)網(wǎng)址)。例如:
http://www.example.com/file1.html
http://www.example.com/file2.html
文本文件站點(diǎn)地圖指南
● 使用 UTF-8 編碼對(duì)您的文件進(jìn)行編碼。
● 請(qǐng)勿在站點(diǎn)地圖文件中添加除網(wǎng)址以外的任何其他內(nèi)容。
● 您可以隨意對(duì)該文本文件進(jìn)行命名,但前提是要確保它的擴(kuò)展名為 .txt(例如,sitemap.txt)。
適用于其他媒體類型的站點(diǎn)地圖擴(kuò)展項(xiàng)
Google 支持適用于以下媒體類型的站點(diǎn)地圖擴(kuò)展語法。您可以使用這些擴(kuò)展功能來描述您網(wǎng)站上的視頻文件、圖片及其他難以解析的內(nèi)容,從而改善索引編制效果。
● 視頻
● 圖片
● Google 新聞
站點(diǎn)地圖一般指南
● 使用一致且完全限定的網(wǎng)址。Google 會(huì)嚴(yán)格按照您列出的網(wǎng)址進(jìn)行抓取。 例如,如果網(wǎng)站位于 https://www.example.com/,請(qǐng)勿將網(wǎng)址指定為 https://example.com/(缺少 www)或 ./mypage.html(相對(duì)網(wǎng)址)。
● 站點(diǎn)地圖可以發(fā)布在網(wǎng)站上的任何位置,但是站點(diǎn)地圖只影響父級(jí)目錄中的下級(jí)目錄。因此,如果站點(diǎn)地圖發(fā)布在網(wǎng)站的根目錄下,則可以影響網(wǎng)站上的所有文件,所以我們建議將站點(diǎn)地圖發(fā)布在此目錄下。
● 請(qǐng)勿在站點(diǎn)地圖中包含網(wǎng)址的會(huì)話 ID。這樣可以減少對(duì)這些網(wǎng)址的重復(fù)抓取。
● 使用 hreflang 注解將其他語言版本的網(wǎng)址告知 Google。
● 您必須對(duì)站點(diǎn)地圖文件進(jìn)行 UTF-8 編碼,并且適當(dāng)?shù)貙?duì)網(wǎng)址進(jìn)行轉(zhuǎn)義。
● 將較大的站點(diǎn)地圖拆分成數(shù)個(gè)較小的站點(diǎn)地圖:站點(diǎn)地圖的網(wǎng)址數(shù)量上限為 50000 個(gè),且壓縮前的大小上限為 50MB。使用站點(diǎn)地圖索引文件列出所有單個(gè)站點(diǎn)地圖,然后將這個(gè)文件提交給 Google,而不是分別提交各個(gè)站點(diǎn)地圖。
● 在站點(diǎn)地圖中僅列出規(guī)范網(wǎng)址。如果您的網(wǎng)頁有兩個(gè)版本,則僅在站點(diǎn)地圖中列出您希望在搜索結(jié)果中顯示的版本。如果您有兩個(gè)版本的網(wǎng)站(例如,www 和非 www),請(qǐng)確定您的首選網(wǎng)站,并將站點(diǎn)地圖放入其中,然后在另一個(gè)網(wǎng)站上添加 rel=canonical 或重定向。
● 如果您為網(wǎng)頁的移動(dòng)版和桌面版提供了不同的網(wǎng)址,建議在站點(diǎn)地圖中僅指向一個(gè)版本。但是,如果您認(rèn)為需要同時(shí)指向這兩個(gè)網(wǎng)址,請(qǐng)為網(wǎng)址添加注解,指明桌面版和移動(dòng)版分別是哪個(gè)。
使用站點(diǎn)地圖擴(kuò)展功能指向視頻、圖片和新聞等其他媒體類型。
● 如果您針對(duì)不同語言或區(qū)域提供了其他版本的網(wǎng)頁,可以在站點(diǎn)地圖或 HTML 標(biāo)記中使用 hreflang 指明其他版本的網(wǎng)址。
● 非字母數(shù)字字符和非拉丁字符。 我們要求您的站點(diǎn)地圖文件使用 UTF-8 編碼(您通??稍诒4嫖募r(shí)指定這種編碼)。和所有 XML 文件一樣,對(duì)于下表中列出的字符,任何數(shù)據(jù)值(包括網(wǎng)址)都必須使用實(shí)體轉(zhuǎn)義碼。站點(diǎn)地圖只能包含 ASCII 字符;它不能包含擴(kuò)展 ASCII 字符、某些控制碼或特殊字符(如 * 和 {})。如果您的站點(diǎn)地圖網(wǎng)址包含這些字符,那么當(dāng)您嘗試添加該網(wǎng)址時(shí),就會(huì)收到錯(cuò)誤消息。
字符 符號(hào) 轉(zhuǎn)義碼
& 符號(hào) & &
單引號(hào) ' '
雙引號(hào) " "
大于號(hào) > >
小于號(hào) < <
此外,所有網(wǎng)址(包括站點(diǎn)地圖的網(wǎng)址)都必須經(jīng)過編碼,以便能被它們所在的且會(huì)對(duì)其網(wǎng)址進(jìn)行轉(zhuǎn)義的網(wǎng)絡(luò)服務(wù)器識(shí)別。不過,如果您使用任何類型的腳本、工具或日志文件(除手動(dòng)輸入網(wǎng)址以外的任何方法)生成網(wǎng)址,這部分工作通常已由系統(tǒng)替您完成。如果您提交了站點(diǎn)地圖,然后卻收到了提示您 Google 無法找到其中某些網(wǎng)址的錯(cuò)誤消息,請(qǐng)檢查并確保網(wǎng)址遵循了適用于 URI 的 RFC-3986 標(biāo)準(zhǔn)、適用于 IRI 的 RFC-3987 標(biāo)準(zhǔn)以及 XML 標(biāo)準(zhǔn)。
下方是一個(gè)采用非 ASCII 字符 (ü) 和需要進(jìn)行實(shí)體轉(zhuǎn)義的字符 (&) 的網(wǎng)址示例:
http://www.example.com/ümlat.html&q=name
下方是采用 ISO-8859-1 編碼(以便在使用該編碼的服務(wù)器上托管)且經(jīng)過網(wǎng)址轉(zhuǎn)義的同一網(wǎng)址:
http://www.example.com/%FCmlat.html&q=name
下方是采用 UTF-8 編碼(以便在使用該編碼的服務(wù)器上托管)且經(jīng)過網(wǎng)址轉(zhuǎn)義的同一網(wǎng)址:
http://www.example.com/%C3%BCmlat.html&q=name
下方是經(jīng)過實(shí)體轉(zhuǎn)義的同一網(wǎng)址:
http://www.example.com/%C3%BCmlat.html&q=name
● 請(qǐng)注意,站點(diǎn)地圖用于向 Google 建議您認(rèn)為重要的網(wǎng)頁,Google 不承諾會(huì)抓取站點(diǎn)地圖中的每個(gè)網(wǎng)址。
● Google 會(huì)忽略 <priority> 和 <changefreq> 值。
● 如果 <lastmod> 值始終準(zhǔn)確并可驗(yàn)證(例如通過與網(wǎng)頁的最后修改日期進(jìn)行比較),Google 會(huì)使用該值。
● 網(wǎng)址在站點(diǎn)地圖中的位置并不重要;Google 不會(huì)按照網(wǎng)址在站點(diǎn)地圖中的顯示順序抓取網(wǎng)址。
創(chuàng)建站點(diǎn)地圖
創(chuàng)建站點(diǎn)地圖,就是在告訴搜索引擎您希望讓哪些網(wǎng)址顯示在搜索結(jié)果中。這些就是規(guī)范網(wǎng)址。如果不同網(wǎng)址下可供訪問的內(nèi)容相同,請(qǐng)選擇您偏好的網(wǎng)址并將其加入站點(diǎn)地圖,而不是將所有指向相同內(nèi)容的網(wǎng)址都加入站點(diǎn)地圖。
在確定要將哪些網(wǎng)址加入站點(diǎn)地圖后,選擇下列方式之一來創(chuàng)建站點(diǎn)地圖,具體取決于您網(wǎng)站的架構(gòu)和大?。?/p>
● 讓您的 CMS 為您生成站點(diǎn)地圖。
● 如果要?jiǎng)?chuàng)建的站點(diǎn)地圖包含的網(wǎng)址不到幾十個(gè),您可以手動(dòng)創(chuàng)建站點(diǎn)地圖。
● 如果要?jiǎng)?chuàng)建的站點(diǎn)地圖包含的網(wǎng)址超過幾十個(gè),請(qǐng)自動(dòng)生成站點(diǎn)地圖。
讓您的 CMS 為您生成站點(diǎn)地圖
如果您使用的是 WordPress、Wix 或 Blogger 等 CMS,那么您的 CMS 可能已經(jīng)向搜索引擎提供了站點(diǎn)地圖。嘗試搜索以下方面的信息:您的 CMS 如何生成站點(diǎn)地圖,或者在您的 CMS 沒有自動(dòng)生成站點(diǎn)地圖時(shí)如何創(chuàng)建站點(diǎn)地圖。例如,如果您使用的是 Wix,請(qǐng)搜索"wix sitemap"。
對(duì)于所有其他網(wǎng)站設(shè)置,您需要自行生成站點(diǎn)地圖。
手動(dòng)創(chuàng)建站點(diǎn)地圖
如果要?jiǎng)?chuàng)建的站點(diǎn)地圖包含的網(wǎng)址不到幾十個(gè),您或許能夠手動(dòng)創(chuàng)建站點(diǎn)地圖。為此,請(qǐng)打開 Windows Notepad、Nano(Linux、MacOS)等文本編輯器,然后按照站點(diǎn)地圖格式部分中所述的語法創(chuàng)建站點(diǎn)地圖。
您可以手動(dòng)創(chuàng)建較大的站點(diǎn)地圖,但此過程非常繁瑣。
自動(dòng)生成站點(diǎn)地圖
如果要?jiǎng)?chuàng)建的站點(diǎn)地圖包含的網(wǎng)址超過幾十個(gè),您需要自動(dòng)生成站點(diǎn)地圖。有很多工具可以生成站點(diǎn)地圖。不過,最好是讓您的網(wǎng)站制作軟件為您生成站點(diǎn)地圖。例如,您可以從您網(wǎng)站的數(shù)據(jù)庫(kù)中提取網(wǎng)站的網(wǎng)址,然后將網(wǎng)址導(dǎo)出到屏幕上或網(wǎng)絡(luò)服務(wù)器的實(shí)際文件中。請(qǐng)與您的開發(fā)者或服務(wù)器管理員討論此解決方案。如果您需要代碼方面的指導(dǎo),不妨看看我們以前匯總的第三方站點(diǎn)地圖生成器。
請(qǐng)注意,站點(diǎn)地圖的大小不得超過 50 MB。詳細(xì)了解如何管理大型站點(diǎn)地圖。
將站點(diǎn)地圖提交給 Google
Google 并非每次抓取網(wǎng)站時(shí)都會(huì)查看站點(diǎn)地圖。我們僅在首次發(fā)現(xiàn)站點(diǎn)地圖時(shí)查看;之后僅在您使用 ping 功能通知我們站點(diǎn)地圖有變更時(shí)查看。請(qǐng)僅在新建或更新站點(diǎn)地圖時(shí)向 Google 發(fā)送站點(diǎn)地圖相關(guān)提醒。如果站點(diǎn)地圖無任何變更,請(qǐng)勿多次向我們提交或 ping 站點(diǎn)地圖。
如果站點(diǎn)地圖中有更新過的網(wǎng)頁,請(qǐng)使用 <lastmod> 字段標(biāo)記這些網(wǎng)頁。 其他 XML 文件有類似的字段,例如 Atom XML 的 <updated>。 您還可以參閱相關(guān)說明,了解如何計(jì)算此日期。
您可通過以下幾種不同方法將站點(diǎn)地圖提交給 Google:
● 使用站點(diǎn)地圖報(bào)告提交站點(diǎn)地圖。
● 使用 ping 工具。在瀏覽器或命令行中向此地址發(fā)送 GET 請(qǐng)求,并指定站點(diǎn)地圖的完整網(wǎng)址。請(qǐng)確保站點(diǎn)地圖文件可供訪問:
https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP
示例:
https://www.google.com/ping?sitemap=https://example.com/sitemap.xml
● 將下面這行內(nèi)容插入到 robots.txt 文件中的任意位置,指定站點(diǎn)地圖的路徑。我們會(huì)在下次抓取 robots.txt 文件時(shí)找到該站點(diǎn)地圖:
Sitemap: https://example.com/my_sitemap.xml
● 如果您的站點(diǎn)地圖采用了 Atom/RSS,并且您想要向 Google 及其他搜索引擎廣播您的更改,請(qǐng)使用 WebSub。
想了解更多SEO資料的內(nèi)容,請(qǐng)?jiān)L問:SEO資料