您好,登錄后才能下訂單哦!
今天小編給大家分享一下百度sitemap網站地圖協議規范及常見問題有哪些的相關知識點,內容詳細,邏輯清晰,相信大部分人都還太了解這方面的知識,所以分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后有所收獲,下面我們一起來了解一下吧。
Sitemap(站點地圖)是一種文件的統稱,通常Sitemap(站點地圖)可以是txt或者XML格式。通過Sitemap(站點地圖)你可以告訴搜索引擎關于你的站點中的網頁、視頻或者其他文件的相關信息,幫助搜索引擎更好的認識和理解你的站點。格式正確的Sitemap(站點地圖)文件會幫助搜索引擎更高效地抓取你的網站。
文件地址格式為txt或xml,每個地址文件最多包含50,000個網址且需小于10MB。
sitemap提交工具僅對已驗證站點開放使用,開發者無法提交同一主域下其他未驗證站點的數據。
請勿提交索引型sitemap,索引型不予處理,且若存在索引型sitemap,將不允許提交新文件;請刪除索引型sitemap后再嘗試提交數據。
在一個txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過站長平臺進行提交
需要遵循以下指南:
文本文件每行都必須有一個網址。網址中不能有換行。
不應包含網址列表以外的任何信息。
您必須書寫完整的網址,包括 http。
每個文本文件最多可包含 50,000 個網址,并且應小于10MB(10,485,760字節)。如果網站所包含的網址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。
文本文件需使用 UTF-8 編碼或GBK編碼。
xml格式提供有關您網站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度Spider參考。
標簽名稱 | 標簽說明 | 標簽類型 | 標簽限制 | 可選/必選 | 舉例 |
---|---|---|---|---|---|
urlset | |||||
url | url標記每條信息的開始和結束 | / | / | 可選 最多出現50000次 | |
url | |||||
loc | 該條數據的存放地址 | 任意URL | 最小長度1個字符 最大長度256個字符 符合正則表達式(http://)(.+) | 必選 | http://www.baidu.com/ |
lastmod | 指該條數據的最新一次更新時間 | 日期或日期時間 | 格式為:YYYY-MM-DD[Thh:mm:ss],日期與時間之間使用T分隔,可以僅提供年月日部分 | 可選 | 2013-01-01 |
changefreq | 指該條數據的更新頻率 | 字符串 | 有效值為:always、hourly、daily、weekly、monthly、yearly、never | 可選 | always |
priority | 用來指定此鏈接相對于其他鏈接的優先權比值,此值定于0.0-1.0之間 | 小數 | 大于等于0.0 小于等于1.0 | 可選 | 1.0 |
<?xml version="1.0" encoding="UTF-8"?> <urlset> <!-- urlset,urlset用來標記整個文檔的開頭,最少出現1次 最多出現1次 --> <url> <!-- url,url標記每條信息的開始和結束,最少出現0次 最多出現50000次 --> <loc>http://www.baidu.com/</loc> <!-- loc,該條數據的存放地址,最少出現1次 最多出現1次,類型為URL地址,最小長度1個字符 最大長度256個字符 必須符合正則表達式(http://)(.+) --> <lastmod>2013-01-01</lastmod> <!-- lastmod,指該條數據的最新一次更新時間,最少出現0次 最多出現1次,類型為日期或日期時間,格式為YYYY-MM-DD的日期或者格式為YYYY-MM-DDThh:mm:ss的日期時間(請注意日期與時間之間以“T”分隔) --> <changefreq>always</changefreq> <!-- changefreq,指該條數據的更新頻率,最少出現0次 最多出現1次,類型為字符串,有效值為:always、hourly、daily、weekly、monthly、yearly、never --> <priority>1.0</priority> <!-- priority,用來指定此鏈接相對于其他鏈接的優先權比值,此值定于0.0-1.0之間,最少出現0次 最多出現1次,類型為小數,最小值為(包含)0.0 最大值為(包含)1.0 --> </url> </urlset>
若有多條url,按照上述格式重復之間的片斷,列明所有url地址,打包到一個xml文件,向站長平臺進行提交。
第一步,將需提交的網頁列表制作成一個Sitemap文件,文件格式請閱讀百度Sitemap協議都支持哪些格式。
第二步,將Sitemap文件放置在網站目錄下。比如您的網站為example.com,您已制作了一個sitemap_example.xml的Sitemap文件,將sitemap_example.xml上傳至網站根目錄即example.com/sitemap_example.xml
第三步,登錄百度站長平臺,確保提交Sitemap數據的網站已驗證歸屬。
第四步,進入Sitemap工具,點擊“添加新數據”,文件類型選擇“URL列表”,填寫抓取周期和Sitemap文件地址
最后,提交完之后,可在Sitemap列表里看到提交的Sitemap文件,如果Sitemap文件里面有新的網站鏈接,可以選擇文件后,點擊更新所選,即對更新的網站鏈接進行了提交。
百度Spider會參考設置周期抓取Sitemap文件,因此請根據Sitemap文件內容的更新(比如增加新url)來設置。請注意若url不變而僅是url對應的頁面內容更新(比如論壇帖子頁有新回復內容),不在此更新范圍內。Sitemap工具不能解決頁面更新問題。
Sitemap數據提交后,一般在1小時內百度會開始處理。在以后的調度抓取中,如果您的sitemap支持etag,我們會更頻繁抓取sitemap文件,從而及時發現內容更新;否則抓取的周期會比較長。
百度對已提交的數據,不保證一定會抓取及收錄所有網址。是否收錄與頁面質量相關。
可以。請使用 gzip 壓縮 Sitemap。無論壓縮與否,Sitemap 應該小于 10MB(10,485,759字節)。
不會。Sitemap 中的“priority”提示只是說明該網址相對于您自己網站上其他網址的重要性,并不會影響網頁在搜索結果中的排名。
不會。網址在 Sitemap 中的位置并不會影響百度對它的識別或使用方式。
因為轉碼問題建議最好不要包含中文。
以上就是“百度sitemap網站地圖協議規范及常見問題有哪些”這篇文章的所有內容,感謝各位的閱讀!相信大家閱讀完這篇文章都有很大的收獲,小編每天都會為大家更新不同的知識,如果還想學習更多的知識,請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。