我們在百度或者其它搜索引擎上輸入一個(gè)關(guān)鍵詞,點(diǎn)擊查詢(xún),搜索引擎會(huì )從先到后列出大量的結果,看到這些結果,我們常會(huì )有疑問(wèn):這些結果是怎么來(lái)的呢?排序的標準又是什么呢?這個(gè)看似簡(jiǎn)單的問(wèn)題,卻是搜索引擎研究的核心難題之一。
為了解答這個(gè)疑問(wèn),特意寫(xiě)了這篇文章,為大家介紹一下百度搜索結果展示的基本工作原理:
一、頁(yè)面抓取原理
搜索引擎在抓取到我們網(wǎng)站的前提是必須要有渠道,當你新建一個(gè)域名,新建了一個(gè)普通頁(yè)面,頁(yè)面沒(méi)有經(jīng)過(guò)任何人的訪(fǎng)問(wèn),也沒(méi)有任何地方出現過(guò)你的頁(yè)面,那么搜索引擎是無(wú)法正確的抓取到你的頁(yè)面的,有些頁(yè)面或網(wǎng)站之所以什么都沒(méi)有操作,搜索引擎也一樣可以抓取和收錄,其原因主要是通過(guò)以下幾個(gè)渠道:
1、鏈接渠道
我們做外鏈的主要目的是什么,是傳遞權重還是能夠更好的讓搜索引擎通過(guò)這個(gè)鏈接來(lái)抓取我們的站點(diǎn)?這是大家都在考慮的一個(gè)問(wèn)題,其實(shí)更重要的是讓搜索引擎能夠通過(guò)此鏈接正確的抓取到我們的網(wǎng)站,這也是SEOER都在說(shuō),現在新站建議做外鏈,老站就沒(méi)必要的原因之一。
2、提交渠道
80%的站點(diǎn)在建立以后會(huì )手動(dòng)提交到搜索引擎,這是搜索引擎在收錄到更多站點(diǎn)的一個(gè)重點(diǎn)渠道,當搜索引擎不知道你的站點(diǎn)存在的時(shí)候,你提交了你的站點(diǎn),這就是直接告訴了搜索引擎,你的站點(diǎn)是存在的,值得搜索引擎的收錄。
3、瀏覽器渠道
百度曾報道,360瀏覽器可根據用戶(hù)流量的網(wǎng)頁(yè)進(jìn)行收集和抓取,也就是說(shuō),當用戶(hù)使用了360瀏覽器瀏覽了某一個(gè)未被360搜索引擎發(fā)現的站點(diǎn),那么360瀏覽器將會(huì )記錄這個(gè)網(wǎng)站,然后將這個(gè)網(wǎng)站放到搜索引擎去處理,同樣,我想百度瀏覽器也會(huì )做類(lèi)似的事情吧。
二、文章收錄原理
一些SEO初學(xué)者,剛接觸百度收錄的時(shí)候,總會(huì )問(wèn):為什么同時(shí)發(fā)布兩篇文章,一篇被收錄,還有一篇未收錄?為何我在大型網(wǎng)站發(fā)布的軟文未收錄?等等收錄問(wèn)題,其實(shí)百度對網(wǎng)站文章收錄這一點(diǎn)看的相對嚴格,所以我們在這一點(diǎn)不能掉以輕心。
當然,收錄的原則也沒(méi)有想象中那么復雜,如果你的網(wǎng)站能夠健康的打開(kāi),收錄基本不是問(wèn)題,只是時(shí)間問(wèn)題,對于百度搜索引擎的收錄工作原理主要有以下3個(gè):
1、對比
當搜索引擎在抓取到你網(wǎng)站的文章頁(yè)面的時(shí)候,會(huì )識別你的每一個(gè)內頁(yè)的相同區與不同區,也就是說(shuō),你網(wǎng)站的不同區將會(huì )被定義為主題內容區域,然后拿著(zhù)你的主題內容與其他網(wǎng)站的主題內容進(jìn)行對比,分出你頁(yè)面主題內容的原創(chuàng )度。
2、分類(lèi)
通過(guò)對你的站點(diǎn)進(jìn)行對比后,可以直接對你的內容進(jìn)行分類(lèi),如同博客的一篇關(guān)于SEO相關(guān)的文章,搜索引擎可直接通過(guò)對比來(lái)判斷,你的網(wǎng)站屬于那種類(lèi)型,是否適合你的站點(diǎn)。
3、用戶(hù)得分
分類(lèi)之后,并不是代表搜索引擎就一定會(huì )收錄你的文章,主要還是要依靠用戶(hù)的得分,用戶(hù)的點(diǎn)擊率、停留時(shí)間判斷出此文的價(jià)值。
通過(guò)以上幾點(diǎn)的算法,當文章的綜合價(jià)值達到搜索引擎的標準值的時(shí)候,搜索引擎將會(huì )對其網(wǎng)站頁(yè)面進(jìn)行收錄。
三、頁(yè)面過(guò)濾原理
很多網(wǎng)站頁(yè)面被百度收錄之后,百度認為該頁(yè)面對用戶(hù)沒(méi)有太大的價(jià)值,或者是質(zhì)量度比較低的頁(yè)面,百度必然就會(huì )過(guò)濾掉,這也是用戶(hù)體驗好的一種表現。
很多站點(diǎn)以?xún)?yōu)化為目的,絲毫不考慮用戶(hù)的體驗,例如一些橋頁(yè)、跳轉頁(yè)面這些就是典型,百度的k站就是一種過(guò)濾頁(yè)面的表現,把那些作弊的站點(diǎn)的頁(yè)面全部的過(guò)濾掉。
很多人抱怨百度多次的k站事件,尤其是那些屌絲站長(cháng)們整天在論壇抱怨這個(gè)抱怨那個(gè),為什么k你的站,很顯然你的站點(diǎn)真的是以用戶(hù)體驗為核心運營(yíng)站嗎?
做SEO的人大多都是為了優(yōu)化而運營(yíng)站點(diǎn),每天寫(xiě)的站內的更新、做外鏈肯定一部分是為了優(yōu)化而優(yōu)化,百度k你的站是犧牲少部分人的利益,更多的用戶(hù)是從中獲益的,要知道每天有上億人在使用百度,如果搜索出來(lái)的信息是你為了優(yōu)化而運營(yíng)的站點(diǎn),低質(zhì)量的頁(yè)面,那百度是拿自己未來(lái)的前途給你優(yōu)化站點(diǎn)做鋪墊的,所以過(guò)濾頁(yè)面這方面百度非常的嚴格。
四、頁(yè)面信息展示原理
一旦搜索引擎抓取到頁(yè)面,并且進(jìn)行了收錄和過(guò)濾后,接下來(lái)就需要給用戶(hù)展示信息了,對此,搜索引擎也需要經(jīng)過(guò)以下2個(gè)主要步驟:
1、建立索引
經(jīng)過(guò)了收錄頁(yè)面以及過(guò)濾頁(yè)面的工作之后,百度會(huì )對這些頁(yè)面逐一進(jìn)行標記和識別,并將這信息進(jìn)行儲存為結構化的數據,儲存到百度的搜索的服務(wù)器中,這些儲存的數據有網(wǎng)頁(yè)的信息、網(wǎng)頁(yè)的標題關(guān)鍵詞頁(yè)面描述等標簽、網(wǎng)頁(yè)外鏈及描述、抓取記錄。
還會(huì )將網(wǎng)頁(yè)中的關(guān)鍵詞信息進(jìn)行識別和儲存,以便與用戶(hù)搜索的內容進(jìn)行匹配,建立完善的索引數據庫,方便呈現出最佳的顯示信息。
2、顯示信息
用戶(hù)輸入的關(guān)鍵詞,百度會(huì )對其進(jìn)行一系列復雜的分析,并根據分析的結論在索引庫中尋找與之最為匹配的一系列網(wǎng)頁(yè),按照用戶(hù)輸入的關(guān)鍵詞所體現的需求強弱和網(wǎng)頁(yè)的優(yōu)劣進(jìn)行打分,并按照最終的分數進(jìn)行排列,展現給用戶(hù),一般顯示出的最佳信息,需要關(guān)鍵詞匹配最高的相關(guān)頁(yè)面。
五、關(guān)鍵詞排名原理
搜索引擎的排名原理是大家最最關(guān)心的話(huà)題,搜索引擎的排名原理是通過(guò)多方面來(lái)給出的,不是單一的站內優(yōu)化做的多好,也不是單一的點(diǎn)擊率有多高,而是根據網(wǎng)站的綜合得分得出排名,這主要由以下幾個(gè)點(diǎn):
1、點(diǎn)擊率
從百度站長(cháng)平臺的關(guān)鍵詞工具可以看出,當你的網(wǎng)站排名在50頁(yè)之前的時(shí)候,點(diǎn)擊率對你的網(wǎng)站有直接影響,這也就是很多網(wǎng)絡(luò )公司接SEO的單,要求你網(wǎng)站的排名必須是多少的原因之一。
2、體驗度
頁(yè)面的體驗度是更具用戶(hù)的需求來(lái)定義的,當用戶(hù)的重點(diǎn)需求在圖片的時(shí)候,那么頁(yè)面的體驗度最核心問(wèn)題就在圖片上面,但是這種簡(jiǎn)單的需求,基本的網(wǎng)站均可滿(mǎn)足,重點(diǎn)還需要在簡(jiǎn)單的需求滿(mǎn)足的情況下,在滿(mǎn)足其他附加需求。
那么,搜索引擎為何能夠知道用戶(hù)的需求呢?主要原因還是用戶(hù)在搜索框搜索的內容均被搜索引擎所記錄。
當然,遇到同樣是圖片的站點(diǎn),排名的好壞還有更多的算法,比如用戶(hù)在瀏覽你的圖片僅用1秒,而瀏覽競爭對手的圖片用了30秒,這就意味著(zhù)競爭對手的內容比你做的好,停留時(shí)間、PV、跳出率成功了搜索引擎重點(diǎn)考核數據。
3、信用度
信用度的積累可直接讓搜索引擎忽略很多細節問(wèn)題,直接給與排名,這就是我們經(jīng)常在大站發(fā)布的外鏈軟件很容易就獲得排名的原理了,一個(gè)大型網(wǎng)站,經(jīng)過(guò)與搜索引擎的磨合,早已被搜索引擎加入到了信任用戶(hù),所以,后期的軟文可以直接讓搜索引擎給他一個(gè)優(yōu)勢排名。