網(wǎng)站標準化一直是困擾網(wǎng)站管理員和搜索引擎的問(wèn)題。據估計,互聯(lián)網(wǎng)上10%到30%的網(wǎng)址是內容相同但網(wǎng)址不同的非標準化網(wǎng)址。
這導致了幾個(gè)問(wèn)題。例如:
對于網(wǎng)站管理員來(lái)說(shuō),多個(gè)URL的存在分散了頁(yè)面的權重,這不利于排名。
對于搜索引擎,它浪費資源和帶寬。
當搜索引擎找到多個(gè)內容相同的網(wǎng)站時(shí),它們不會(huì )受到懲罰,但會(huì )試圖找到應該標準化的網(wǎng)站。但畢竟,程序只是一個(gè)程序,可能會(huì )出錯。它可能不是網(wǎng)站管理員想要的標準化網(wǎng)站。
如果網(wǎng)站地址的標準化過(guò)于嚴重,也可能影響網(wǎng)站的收錄。對于低權重的域名,可以包含的總頁(yè)數是有限的。搜索引擎在不規則的網(wǎng)站上花費資源,為真正不同的內容留下更少的資源。
還有許多解決URL規范化問(wèn)題的選項,例如:
在Google管理員工具中,設置有或沒(méi)有3W的標準版本。
使用301將所有不規則URL轉換為規范化URL
確保使用的CMS系統只生成標準化的網(wǎng)址
確保網(wǎng)站上的所有鏈接指向標準化網(wǎng)站
指定提交給搜索引擎的網(wǎng)站圖中的所有標準化網(wǎng)址
但這些方法有其自身的局限性。
谷歌管理員工具不適用于其他搜索引擎
有些站長(cháng)因為某種原因不能轉301
CMS系統基本失控
內部鏈接可以由自己控制,但其他鏈接不能由自己網(wǎng)站的鏈接控制。
簡(jiǎn)而言之,盡管有其他解決方案,但網(wǎng)站標準化仍然是一個(gè)問(wèn)題。
谷歌、雅虎和微軟聯(lián)合發(fā)布了一個(gè)新標簽,佳能,以解決網(wǎng)站的標準化問(wèn)題。
簡(jiǎn)單地說(shuō),就是在HTML文件的頭部添加這樣一段代碼: <linkrel=“canonical”href=“http://www.example.com/product.php?”swedish-fish“/>
這意味著(zhù)該網(wǎng)頁(yè)的標準化網(wǎng)站應:
http://www.example.com/product.php?
以下URL可以添加此代碼:
http://www.example.com/product.php?item=SwedishFish&category=Gummy
http://www.example.com/product.php?item=瑞典魚(yú)&trackingid=1234&sessionid=5678
這些URL的真正標準化地址是:
http://www.example.com/product.php?
簡(jiǎn)單地說(shuō),這個(gè)標簽在一頁(yè)中是一個(gè)301的轉折點(diǎn)。區別在于用戶(hù)沒(méi)有轉向,或者停留在同一個(gè)網(wǎng)站上,而搜索引擎將其視為301轉向處理,也就是說(shuō),頁(yè)面鏈接的權重集中在規范的網(wǎng)站代碼中。