今天給大家講講SEO搜索引擎的技術(shù)機理和市場(chǎng)競爭的一些特點(diǎn)。當然,作為從事或有興趣從事流量運營(yíng)的朋友,是可以用另一個(gè)角度去理解本文。
搜索引擎的核心技術(shù)架構,大體包括以下三塊,第一,是蜘蛛/爬蟲(chóng)技術(shù);第二,是索引技術(shù);第三是查詢(xún)展現的技術(shù);當然,我不是搜索引擎的架構師,我只能用比較粗淺的方式來(lái)做一個(gè)結構的切分。
蜘蛛,也叫爬蟲(chóng),是將互聯(lián)網(wǎng)的信息,抓取并存儲的一種技術(shù)實(shí)現。
搜索引擎的信息收錄,很多不明所以的人會(huì )有很多誤解,以為是付費收錄,或者有什么其他特殊的提交技巧,其實(shí)并不是,搜索引擎通過(guò)互聯(lián)網(wǎng)一些公開(kāi)知名的網(wǎng)站,抓取內容,并分析其中的鏈接,然后有選擇的抓取鏈接里的內容,然后再分析其中的鏈接,以此類(lèi)推,通過(guò)有限的入口,基于彼此鏈接,形成強大的信息抓取能力。
有些搜索引擎本身也有鏈接提交入口,但基本上,不是主要的收錄入口,不過(guò)作為創(chuàng )業(yè)者,建議了解一下相關(guān)信息,百度,google都有站長(cháng)平臺和管理后臺,這里很多內容是需要非常非常認真的對待的。
反過(guò)來(lái)說(shuō),在這樣的原理下,一個(gè)網(wǎng)站,只有被其他網(wǎng)站所鏈接,才有機會(huì )被搜索引擎抓取。如果這個(gè)網(wǎng)站沒(méi)有外部鏈接,或者外部鏈接在搜索引擎中被認為是垃圾或無(wú)效鏈接,那么搜索引擎可能就不抓取他的頁(yè)面。
分析和判斷搜索引擎是否抓取了你的頁(yè)面,或者什么時(shí)候抓取你的頁(yè)面,只能通過(guò)服務(wù)器上的訪(fǎng)問(wèn)日志來(lái)查詢(xún),如果是cdn就比較麻煩。而基于網(wǎng)站嵌入代碼的方式,不論是cnzz,百度統計,還是googleanalytics,都無(wú)法獲得蜘蛛抓取的信息,因為這些信息不會(huì )觸發(fā)這些代碼的執行。