帝國CMS中robots.txt文件的使用方法

發布時間：2020-09-30 15:59:44 來源：億速云閱讀：266 作者：小新欄目：建站服務器

這篇文章給大家分享的是有關帝國CMS中robots.txt文件的使用方法的內容。小編覺得挺實用的，因此分享給大家做個參考。一起跟隨小編過來看看吧。

在說帝國CMS中robots.txt文件使用前先給大家解釋下robots.tx是干什么的.

robots協議（也稱為爬蟲協議、爬蟲規則、機器人協議等）也就是robots.txt，網站通過robots協議告訴搜索引擎哪些頁面可以抓取，哪些頁面不能抓取。Robots協議是網站國際互聯網界通行的道德規范，其目的是保護網站數據和敏感信息、確保用戶個人信息和隱私不被侵犯。因其不是命令，故需要搜索引擎自覺遵守。一些病毒如malware（馬威爾病毒）經常通過忽略robots協議的方式，獲取網站后臺數據和個人信息。

robots.txt文件是一個文本文件，使用任何一個常見的文本編輯器，比如Windows系統自帶的Notepad，就可以創建和編輯它。robots.txt是一個協議，而不是一個命令。robots.txt是搜索引擎中訪問網站的時候要查看的第一個文件。robots.txt文件告訴蜘蛛程序在服務器上什么文件是可以被查看的。

推薦學習《帝國cms教程》

當一個搜索蜘蛛訪問一個站點時，它會首先檢查該站點根目錄下是否存在robots.txt，如果存在，搜索機器人就會按照該文件中的內容來確定訪問的范圍；如果該文件不存在，所有的搜索蜘蛛將能夠訪問網站上所有沒有被口令保護的頁面。百度官方建議，僅當您的網站包含不希望被搜索引擎收錄的內容時，才需要使用robots.txt文件。如果您希望搜索引擎收錄網站上所有內容，請勿建立robots.txt文件。

如果將網站視為酒店里的一個房間，robots.txt就是主人在房間門口懸掛的“請勿打擾”或“歡迎打掃”的提示牌。這個文件告訴來訪的搜索引擎哪些房間可以進入和參觀，哪些房間因為存放貴重物品，或可能涉及住戶及訪客的隱私而不對搜索引擎開放。但robots.txt不是命令，也不是防火墻，如同守門人無法阻止竊賊等惡意闖入者。

帝國CMS默認robots.txt為:

代碼如下:

#
# robots.txt for EmpireCMS
#
User-agent: * *允許所有搜索引擎抓取
Disallow: /d/ *禁止所有搜索引擎抓取D目錄
Disallow: /e/class/ *禁止所有搜索引擎抓取/e/class/ 目錄
Disallow: /e/data/ *禁止所有搜索引擎抓取/e/data/ 目錄
Disallow: /e/enews/ *禁止所有搜索引擎抓取/e/enews/ 目錄
Disallow: /e/update/ *禁止所有搜索引擎抓取/e/update/ 目錄

感謝各位的閱讀！關于帝國CMS中robots.txt文件的使用方法就分享到這里了，希望以上內容可以對大家有一定的幫助，讓大家可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到吧！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

帝國CMS中robots.txt文件的使用方法

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

帝國CMS中robots.txt文件的使用方法

猜你喜歡

最新資訊

相關推薦

相關標簽