搜索引擎的工作過(guò)程是引擎蜘蛛爬行和抓取、索引和排名。排名,即用戶(hù)輸入關(guān)鍵詞后,排名程序調用索引數據庫,計算相關(guān)性,然后按一定格式生成搜索結果頁(yè)面。
排名過(guò)程是與用戶(hù)直接互動(dòng)的
01-搜索詞處理:中文分詞處理,去除用戶(hù)搜索中的停止詞,指令處理,糾正拼寫(xiě)錯誤,整合索引出發(fā)。
02文件匹配:找出含有所有關(guān)鍵詞的文件。
03-初始子集的選擇:文件匹配得出的子集還不能直接計算,因為匹配到的文件通常會(huì )幾十幾百上千萬(wàn),對這么多文件實(shí)時(shí)計算相關(guān)性需要很長(cháng)時(shí)間,根據權重和相關(guān)性,百度提供76頁(yè)大約760個(gè)搜索結果,故會(huì )先選出權重較高的一個(gè)子集。
04-相關(guān)性計算:關(guān)鍵詞常用程度、詞頻及密度,關(guān)鍵詞位置及型式,關(guān)鍵詞距離、鏈接分析及頁(yè)面權重。
05-排名過(guò)濾及調整:主要過(guò)濾是施加懲罰,減少垃圾內容、作弊嫌疑頁(yè)面,如百度11位,算法。
06-排名顯示:經(jīng)排名程序調用原始頁(yè)面的標題、描述標簽、快照日期等。
07-搜索緩存:用戶(hù)搜索的關(guān)鍵詞有很大一部分是重復的,將最常見(jiàn)的搜索詞存入緩存,縮短搜索反應時(shí)間。
08-查詢(xún)及點(diǎn)擊日志:記錄用戶(hù)的IP地址、搜索的關(guān)聯(lián)詞、搜索時(shí)間及點(diǎn)擊了哪些頁(yè)面并存入搜索庫。
網(wǎng)站優(yōu)化技術(shù)配合一些搜索引擎高級指令將使得優(yōu)化工作變得簡(jiǎn)單,以下是baidu、google支持的高級指令。
SEO高級指令
01-雙引號(“”):完全匹配搜索。
02-減號(-):搜索時(shí)排除減號后面的內容。如:搜“花 -牡丹”,返回只出現含“花”但不含“牡丹”頁(yè)面。
04-inurl:搜索結果中內容及其下面的網(wǎng)址含inurl括號里面的內容。如:搜“inurl:騰訊”,返回頁(yè)面標題、內容及網(wǎng)址至少都含有“騰訊”。
05-intitle:返回的是頁(yè)面title中包含關(guān)鍵詞的頁(yè)面。如“intitle:魅族”。
06-filetype:找出當前收錄在搜索引擎中的文件。如:搜“filetype:pdf”,返回含有pdf文件頁(yè)面。(百度僅支持搜索ppt、xls、doc、rtf、pdf、txt)
07-domian:后跟完整域名,查詢(xún)網(wǎng)站被百度收錄的反向鏈接數目。
排名過(guò)程是將搜索結果反饋給用戶(hù),網(wǎng)站優(yōu)化配合搜索引擎高級指令將使得優(yōu)化工作變得簡(jiǎn)單。