欧美一区二区三区四区视频|久久久久久88色偷偷|国产精品视频一区二区三区w|国产综合色在线视频|久久久久久综合七次郎|好硬好紧好湿进去了好爽

7x24：18255121122
瘋狗微信
- 掃描二維碼
- 關(guān)注瘋狗微信平臺
手機網(wǎng)站
- 手機掃描二維碼
- 進(jìn)入手機站
網(wǎng)站地圖
幫助中心
備案登錄

合肥做網(wǎng)站，選擇瘋狗科技，專(zhuān)業(yè)、敬業(yè)的合肥網(wǎng)絡(luò )公司

首頁(yè) > 網(wǎng)站SEO優(yōu)化 > 詳情

相關(guān)欄目 / Category

互聯(lián)網(wǎng)產(chǎn)品交互網(wǎng)絡(luò )推廣網(wǎng)站技術(shù) 網(wǎng)絡(luò )雜談網(wǎng)站SEO優(yōu)化網(wǎng)站服務(wù)器

互聯(lián)網(wǎng)課堂 / ClassRoom

VIEW MORE

最新文章 / News

猜你喜歡 / Before You Like

網(wǎng)站標簽 / Tags

網(wǎng)站優(yōu)化網(wǎng)站建設網(wǎng)站 SEO優(yōu)化合肥瘋狗 seo 網(wǎng)站運營(yíng) 關(guān)鍵詞網(wǎng)站seo優(yōu)化安徽網(wǎng)站排名網(wǎng)站權重滁州科技企業(yè)網(wǎng)站搜索引擎服務(wù)器互聯(lián)網(wǎng) 企業(yè) 技巧 seo網(wǎng)站優(yōu)化域名網(wǎng)站設計方法合肥網(wǎng)站優(yōu)化合肥做網(wǎng)站用戶(hù) 網(wǎng)站服務(wù)器內容網(wǎng)站降權優(yōu)化網(wǎng)站推廣企業(yè)網(wǎng)站建設材料網(wǎng)絡(luò )推廣頁(yè)面效果網(wǎng)絡(luò )營(yíng)銷(xiāo) 因素網(wǎng)絡(luò )公司網(wǎng)站流量友情鏈接策略百度優(yōu)化錯誤網(wǎng)站收錄專(zhuān)業(yè) 網(wǎng)站seo 關(guān)鍵詞優(yōu)化方面手機企業(yè)網(wǎng)站優(yōu)化網(wǎng)站關(guān)鍵詞用戶(hù)體驗合肥網(wǎng)站制作搜索引擎優(yōu)化公司中國網(wǎng)站轉化率網(wǎng)站域名合肥網(wǎng)站建設網(wǎng)站制作網(wǎng)站開(kāi)發(fā) 網(wǎng)頁(yè)設計網(wǎng)站備案電商技術(shù) 原因網(wǎng)頁(yè)

VIEW MORE

秒懂robots.txt寫(xiě)法和注意事項！

2019-03-07 08:41:35 來(lái)源：互聯(lián)網(wǎng) 瀏覽：次

robots txt直接放在網(wǎng)站根目錄下，是蜘蛛訪(fǎng)問(wèn)網(wǎng)站時(shí)，第一個(gè)抓取的文件。robots txt是告訴蜘蛛網(wǎng)站的哪些文件允許抓取，哪些文件不允許抓取，甚至可以指定特定的蜘蛛能不能抓取特定的文件。沒(méi)有抓取就沒(méi)有收錄，沒(méi)有收錄就沒(méi)有

robots.txt直接放在網(wǎng)站根目錄下，是蜘蛛訪(fǎng)問(wèn)網(wǎng)站時(shí)，第一個(gè)抓取的文件。robots.txt是告訴蜘蛛網(wǎng)站的哪些文件允許抓取，哪些文件不允許抓取，甚至可以指定特定的蜘蛛能不能抓取特定的文件。沒(méi)有抓取就沒(méi)有收錄，沒(méi)有收錄就沒(méi)有排名。所以作為第一蜘蛛訪(fǎng)問(wèn)的文件，寫(xiě)好robots.txt是很重要的，寫(xiě)好robots.txt后，一定要再檢查一兩遍，以防出錯。這里總結下robots.txt寫(xiě)法，讓你看完秒懂robots.txt寫(xiě)法和注意事項。

一.robots.txt具體作用

1.對搜索引擎做出規定，抓取或者不抓取。

2.由于有些信息規定了不讓抓取，所以可以保護到一些必要的信息，比如：網(wǎng)站后臺，用戶(hù)信息。

3.節省搜索引擎抓取資源。

二.robots.txt規則

1.User-agent，用于告訴識別蜘蛛類(lèi)型。比如，User-agent: Baiduspider 就是指百度蜘蛛。

各類(lèi)蜘蛛列舉如下：

百度蜘蛛：Baiduspider

谷歌機器人：GoogleBot

360蜘蛛：360Spider

搜狗蜘蛛：Sogou News Spider

雅虎蜘蛛：“Yahoo! Slurp China” 或者 Yahoo!

有道蜘蛛：Youdaobot 或者 Yodaobot

Soso蜘蛛：Sosospider

2.Allow，允許蜘蛛抓取指定目錄或文件，默認是允許抓取所有。

3.Disallow，不允許蜘蛛抓取指定目錄或文件。

4.通配符，“*”，匹配0或多個(gè)任意字符。

5.終止符，“$”，可以匹配以指定字符結尾的字符。

舉個(gè)例子：下面是一個(gè)wordpress程序的robots.txt

User-agent: *

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /wp-content/plugins

Disallow: /wp-content/themes

Disallow: /feed

Disallow: /*/feed

Disallow: /comments/feed

Disallow: /*.js$

Disallow: /*?*

Sitemap: http://www.leheseo.com/sitemap.xml

解釋?zhuān)?/strong>

User-agent: *：對所有搜索引擎都使用下面的規則。

Disallow: /wp-admin/：不讓蜘蛛抓取根目錄下的wp-admin文件夾。

Disallow: /*.js$：不讓蜘蛛抓取根目錄下所有的js文件。

Disallow: /*?*：不抓取所有的動(dòng)態(tài)鏈接。

Sitemap: http://www.leheseo.com/sitemap.xml：給蜘蛛提供網(wǎng)站地圖，方便蜘蛛抓取網(wǎng)站內容。

三.robots.txt注意事項

1.如果你希望搜索引擎收錄網(wǎng)站上所有的內容，那么就不要建立robots.txt文件。

2.如果同時(shí)存在動(dòng)態(tài)和靜態(tài)鏈接，那么建議屏蔽動(dòng)態(tài)鏈接。

3.robots.txt只能是屏蔽站內文件的，對站外文件沒(méi)有屏蔽功能。

4.User-agent，Allow，Disallow，Sitemap的首字母都是大寫(xiě)的。

5.User-agent，Allow，Disallow，Sitemap的冒號后面都是有空格的，沒(méi)有寫(xiě)空格直接寫(xiě)接下來(lái)的內容會(huì )出錯。

6.網(wǎng)站通常會(huì )屏蔽搜索結果頁(yè)面。因為搜索結果頁(yè)和正常展示的內容頁(yè)相比，標題和內容上相同的，而這兩個(gè)頁(yè)面鏈接是不同的。那搜索引擎該將這篇文章歸屬于哪個(gè)內鏈呢?這樣就會(huì )造成內鏈之間相互競爭，造成內部資源損耗。

比如上面舉的例子，那個(gè)wordpress程序，在沒(méi)有設置偽靜態(tài)，還是動(dòng)態(tài)鏈接的時(shí)候，搜索結果頁(yè)面鏈接都包含有/?s=，而標題和內容與正常展示的動(dòng)態(tài)鏈接內容頁(yè)重復，可以通過(guò)Disallow: /?=*來(lái)屏蔽搜索結果頁(yè)面。

而現在那個(gè)wordpress程序已經(jīng)設置了偽靜態(tài)，也設置了Disallow: /*?*，Disallow: /*?*本身就包含了Disallow: /?=*，所以Disallow: /?=*這句寫(xiě)不寫(xiě)都沒(méi)有關(guān)系

7.建議屏蔽js文件。Disallow: /*.js$，以 .js 結尾的路徑統統被屏蔽，這樣就屏蔽了js文件。

8.路徑是區分大小寫(xiě)的。Disallow: /ab/ 和 Disallow: /Ab/ 是不一樣的。

9.robots.txt會(huì )暴露網(wǎng)站相關(guān)目錄，寫(xiě)robots.txt時(shí)要考慮到這一點(diǎn)。

10.有些seo會(huì )將文件直接備份在服務(wù)器中，文件是 .zip 格式，然后在robots.txt中屏蔽。個(gè)人不建議這樣，這就是明顯告訴人家你的備份文件位置。建議文件和數據都備份到本地。

11.一些特殊規則對比：

①Disallow: /和Disallow: / ab (/后面有個(gè)空格，再有ab)是一樣的，/后面多了個(gè)空格，蜘蛛之認空格前面那一段，就是Disallow: /，所以?xún)蓚€(gè)都是屏蔽整站的。

②Disallow: /ab和Disallow: /ab*是一樣的。比如兩個(gè)都能屏蔽http://域名/ab，http://域名/abc，http://域名/abcd。

③Disallow: /ab/和Disallow: /ab是不一樣的。很明顯，Disallow: /ab范圍更廣，包含了Disallow: /ab/。因為Disallow: /ab/只能屏蔽http：//域名/ab/，http：//域名/ab/....這樣的路徑，也就是只能屏蔽ab目錄和ab目錄下的文件不被蜘蛛抓取。

四.驗證robots.txt文件的正確性和是否生效

當我們寫(xiě)好了robots.txt文件后，怎么確定文件的正確性呢?上傳到服務(wù)器根目錄后，怎么判斷robots.txt文件是否生效了呢?這時(shí)我們可以借助百度資源平臺Robots。比如輸入樂(lè )呵SEO測試服網(wǎng)址，得到如下結果。

驗證robots.txt文件是否生效

檢測到robots.txt文件的內容

驗證robots.txt文件的正確性

結果證明，http://wordpress.leheseo.com/robots.txt這個(gè)文件沒(méi)有語(yǔ)法錯誤，并且已經(jīng)生效了。

若是想測試某一個(gè)目錄或者文件是否被屏蔽了，百度也是提供了工具的。如下圖，由于 http://wordpress.leheseo.com 是測試服，我屏蔽了所有文件。所以無(wú)論我輸入根目錄下的任何目錄或者任何文件，都是檢測不到的，也就是說(shuō)蜘蛛是抓取不到的。

輸入了后臺目錄wp-admin：

后臺目錄檢測結果：

經(jīng)過(guò)測試，其他文件和目錄頁(yè)也檢測不到，所以這個(gè)功能還是很好用的。

更多robots.txt內容，可以參考百度提供的文檔哦。https://ziyuan.baidu.com/college/courseinfo?id=267&page=12

robots.txt寫(xiě)法和注意事項就總結到這里了，內容相對細致，結合了例子講解會(huì )很容易看懂，希望對您有所幫助咯。

相關(guān)熱詞搜索：robots txt寫(xiě)法 上一篇：什么是301重定向，具體是什么意思？ 下一篇：熊掌號上線(xiàn)小時(shí)、天級和周級收錄的區別！

相關(guān)閱讀 / Relation

robots協(xié)議與網(wǎng)站地圖

SEO教你玩轉robots協(xié)議

SEO教你玩轉robots協(xié)議

你不知道的robots文件那些事

網(wǎng)站robots文件沒(méi)做好帶來(lái)的影響不可小視

了解瘋狗
瘋狗簡(jiǎn)介

瘋狗文化

企業(yè)資質(zhì)

發(fā)展歷程

聯(lián)系瘋狗

團隊介紹

支付方式

產(chǎn)品與服務(wù)
營(yíng)銷(xiāo)網(wǎng)站建設

移動(dòng)網(wǎng)站建設

網(wǎng)站SEO優(yōu)化

網(wǎng)站代維托管

域名注冊

服務(wù)器主機

運營(yíng)策劃

軟件開(kāi)發(fā)

微信平臺搭建

品牌優(yōu)化

聯(lián)系瘋狗
QQ：613835522

微信公眾號：瘋狗科技

咨詢(xún)熱線(xiàn)：13349204444

投訴熱線(xiàn)：18075250033（工作日）

地址：合肥市包河區和昌中心B座12層

安徽思躍科技為企業(yè)提供專(zhuān)業(yè)的網(wǎng)站建設、網(wǎng)站seo優(yōu)化等服務(wù)，致力打造專(zhuān)業(yè)、客戶(hù)放心的合肥網(wǎng)絡(luò )公司！

版權所有：MadDog? Tech Copyright ? 2017 瘋狗?科技皖I(lǐng)CP備14008810號-4 皖公網(wǎng)安備 34010202600669

部分圖片、內容來(lái)自互聯(lián)網(wǎng)，如有侵權請聯(lián)系我們刪除

售前咨詢(xún)：

售前咨詢(xún)：

技術(shù)支持：

電話(huà)：0551-66191122

手機：13349204444

郵箱：mail@maddog.cc

工作時(shí)間：9:00-18:00

7x24小時(shí)緊急電話(huà)

18255121122

更多聯(lián)系方式 >>

欧美一区二区三区四区视频|久久久久久88色偷偷|国产精品视频一区二区三区w|国产综合色在线视频|久久久久久综合七次郎|好硬好紧好湿进去了好爽