鏡像網(wǎng)站指的是別人將你的網(wǎng)站數據進(jìn)行的同步,網(wǎng)站的界面及內容基本上都和你的網(wǎng)站保持一致,如果不是兩個(gè)網(wǎng)站的主域不同站長(cháng)自己都會(huì )認為是一個(gè)網(wǎng)站,兩個(gè)網(wǎng)站之間就像鏡子成像一樣因此稱(chēng)為鏡像網(wǎng)站。
思維淺析
鏡像網(wǎng)站本身是沒(méi)有多大危害的,比如一些知名度較高的站點(diǎn)通過(guò)設置鏡像網(wǎng)站,用于預防網(wǎng)絡(luò )故障保證用戶(hù)的正常訪(fǎng)問(wèn)體驗。但對于中小網(wǎng)站的SEO(依賴(lài)搜搜引擎獲取流量)而言卻有著(zhù)不小的影響,那么如何及時(shí)發(fā)現網(wǎng)站被鏡像呢?遇到網(wǎng)站鏡像又該如何處理?
自己設置網(wǎng)站鏡像是為了應對突發(fā)網(wǎng)絡(luò )故障的一種策略,但在不知道的情況下被鏡像大都是不懷好意的。要么是同行惡意競爭對你的網(wǎng)站進(jìn)行負面SEO,要么為了利用你的網(wǎng)站內容獲得排名,然后把用戶(hù)轉向到非法的內容網(wǎng)站,僅僅是為了不讓域名閑置而鏡像的網(wǎng)站基本不存在。
采集站和鏡像站的區別
上邊提到鏡像網(wǎng)站是為了利用網(wǎng)站內容快速獲得排名,因此有人認為鏡像指的是采集,雖然從利用網(wǎng)站內容的目的來(lái)看兩者是相同的,但采集站與鏡像站在技術(shù)手段以及展現形式上還是有區別的。
采集站一般是提前將網(wǎng)站內容抓取,然后發(fā)布在自己網(wǎng)站程序進(jìn)行內容發(fā)布。當被采集站更新內容之后,采集站需要重新采集并進(jìn)行發(fā)布。但鏡像網(wǎng)站并不需要提前抓取被鏡像站內容,而是在用戶(hù)訪(fǎng)問(wèn)時(shí)實(shí)時(shí)從被鏡像的網(wǎng)站調取內容,期間會(huì )進(jìn)行一些URL替換或者文字修改及添加js的操作。也就是說(shuō)鏡像網(wǎng)站在遇到目標站點(diǎn)更新時(shí),不需要進(jìn)行重新采集操作,就能保證網(wǎng)站的內容同步。
被鏡像網(wǎng)站SEO有什么影響
那么鏡像網(wǎng)站對被鏡像網(wǎng)站SEO的影響,主要在于其他網(wǎng)站擁有和你的網(wǎng)站重復的內容,對不太完善的原創(chuàng )分析算法而言,很有可能將鏡像網(wǎng)站當做優(yōu)質(zhì)站點(diǎn)給予排名,而對被鏡像站點(diǎn)進(jìn)行懲罰或者限制。因此對中小站點(diǎn)來(lái)說(shuō),在被別人不懷好意的鏡像之后,很有可能影響到搜索引擎端的流量占比。
雖然對于高權重網(wǎng)站而言,不會(huì )被鏡像站點(diǎn)搶奪搜索端流量,但卻很可能造成網(wǎng)站用戶(hù)分不清哪個(gè)是李逵哪個(gè)是李鬼,或者把用戶(hù)引流到灰色行業(yè)網(wǎng)站造成品牌形象受損。
如何及時(shí)發(fā)現網(wǎng)站被鏡像
一般網(wǎng)站都添加了統計工具,因此可以通過(guò)分析相關(guān)數據發(fā)現受訪(fǎng)域名異常,但現在的網(wǎng)站鏡像工具很容易替換或者刪除統計代碼,因此這種方法并不能發(fā)現所有的鏡像網(wǎng)站。因此站長(cháng)可通過(guò)搜索網(wǎng)頁(yè)中的特征句,比如網(wǎng)站品牌詞或者首頁(yè)標題等,但考慮到這類(lèi)詞被替換的可能性很大,更建議選擇頁(yè)面中的品牌廣告語(yǔ),而非文章內容中的句子(大都為采集站)。雖然沒(méi)有一種方法可以做到查無(wú)遺漏,但是可以嘗試多種方法進(jìn)行檢測,以便能及時(shí)發(fā)現網(wǎng)站是否被鏡像。
網(wǎng)站被鏡像后如何處理
網(wǎng)上可以看到不少網(wǎng)站被鏡像的處理方法,但由于內容比較久遠且鏡像工具的更新升級,很多方法已經(jīng)無(wú)法做到有效處理了。比如將網(wǎng)頁(yè)中的鏈接改為絕對地址,然而面對可以自動(dòng)替換網(wǎng)站的鏡像工具,無(wú)論是絕對地址還是相對地址沒(méi)啥差別。
網(wǎng)站被鏡像后的處理原則就是,阻止鏡像站點(diǎn)對網(wǎng)站內容進(jìn)行同步??梢钥紤]添加JS代碼檢測頁(yè)面是否在自己的域名下受訪(fǎng),這樣自己的網(wǎng)站可正常顯示內容,而非自己域名(鏡像網(wǎng)站)被訪(fǎng)問(wèn)時(shí)強迫跳轉回自己的網(wǎng)站。這樣雖然能挽回用戶(hù)體驗,但搜索引擎并不會(huì )執行該JS代碼,還是會(huì )抓取鏡像站點(diǎn)內容。
最有效的處理辦法就是對鏡像網(wǎng)站的來(lái)訪(fǎng)IP進(jìn)行屏蔽,通過(guò)服務(wù)器端設置IP黑名單阻斷對網(wǎng)站的實(shí)時(shí)同步。但需要注意的是用來(lái)抓取的IP可能不是域名IP而是CDN或者虛擬IP,因此需要通過(guò)查看分析網(wǎng)站日志篩選可疑IP。熟悉程序的站長(cháng)可以編寫(xiě)腳本放到自己的網(wǎng)站根目錄中,該腳本的功能用于顯示IP,切換到鏡像站域名訪(fǎng)問(wèn)該腳本即可得到鏡像站IP。
發(fā)現鏡像網(wǎng)站除過(guò)阻止其對網(wǎng)站的實(shí)時(shí)同步之外,還可以向搜索引擎提交問(wèn)題,或者向域名注冊商以及主機服務(wù)商投訴。優(yōu)秀的SEOer不僅需要熟悉搜索引擎算法,以及常規的SEO操作,同時(shí)還需要涉及網(wǎng)站安全以及數據統計網(wǎng)站日志的分析,不斷提升對網(wǎng)站及搜索引擎的認識。