并不是所有的網(wǎng)頁(yè)對用戶(hù)都有意義,比如一些明顯的欺騙網(wǎng)頁(yè)、死鏈接、空白內容頁(yè)等。這些網(wǎng)頁(yè)對用戶(hù)、站長(cháng)和百度來(lái)說(shuō)都不夠有價(jià)值,所以百度會(huì )自動(dòng)過(guò)濾這些內容,避免給用戶(hù)和你的網(wǎng)站帶來(lái)不必要的麻煩。
搜索引擎為用戶(hù)顯示的每個(gè)搜索結果都對應于互聯(lián)網(wǎng)上的一個(gè)頁(yè)面,每個(gè)搜索結果都需要四個(gè)過(guò)程:抓取、過(guò)濾、索引和輸出。
1、抓取
百度蜘蛛,或稱(chēng)百度蜘蛛,將通過(guò)計算確定哪些網(wǎng)站需要爬行,以及爬行的內容和頻率,通過(guò)搜索引擎系統進(jìn)行計算。搜索引擎的計算過(guò)程將參考您網(wǎng)站在歷史上的表現,如內容是否足夠好,是否有用戶(hù)友好的設置,是否有過(guò)度的搜索引擎優(yōu)化行為等。
當你的網(wǎng)站生成新內容時(shí),baiduspider會(huì )通過(guò)一個(gè)鏈接訪(fǎng)問(wèn)并爬行到互聯(lián)網(wǎng)上的頁(yè)面。如果你沒(méi)有設置任何外部鏈接到網(wǎng)站上的新內容,Baiduspider就無(wú)法對其進(jìn)行爬行。對于已捕獲的內容,搜索引擎將記錄捕獲的頁(yè)面,并根據這些頁(yè)面對用戶(hù)的重要性,安排不同頻率的捕獲更新。
需要注意的是,有一些爬行軟件,出于各種目的,會(huì )偽裝成baiduspider來(lái)爬行你的網(wǎng)站,這可能是不受控制的爬行行為,嚴重影響了網(wǎng)站的正常運行。點(diǎn)擊此處確認白杜鵑的真實(shí)性。
2、過(guò)濾
并不是所有的網(wǎng)頁(yè)對用戶(hù)都有意義,比如一些明顯的欺騙網(wǎng)頁(yè)、死鏈接、空白內容頁(yè)等。這些網(wǎng)頁(yè)對用戶(hù)、站長(cháng)和百度來(lái)說(shuō)都不夠有價(jià)值,所以百度會(huì )自動(dòng)過(guò)濾這些內容,避免給用戶(hù)和你的網(wǎng)站帶來(lái)不必要的麻煩。
3、索引
百度對檢索到的內容逐一進(jìn)行標記和識別,并將這些標記存儲為結構化數據,如標記標題、元描述、外部鏈接、描述和捕獲記錄。同時(shí),網(wǎng)頁(yè)中的關(guān)鍵字信息將被識別和存儲,以便與用戶(hù)搜索的內容相匹配。
4、輸出
百度將對用戶(hù)輸入的關(guān)鍵詞進(jìn)行一系列復雜的分析,并根據分析結論在索引數據庫中找到一系列與之最匹配的頁(yè)面。關(guān)鍵字根據用戶(hù)的需求和頁(yè)面的優(yōu)缺點(diǎn)進(jìn)行評分,并根據最終得分進(jìn)行排列,并顯示給用戶(hù)。
更多SEO教程:http://www.cenhuiyu.com/