一、網(wǎng)站內容重復的情況
1、同樣一篇文章出現多個(gè)URL,即使這篇文章屬于原創(chuàng ),也會(huì )被百度給予懲罰。
2、網(wǎng)站內容多為采集,這種網(wǎng)站內容重復會(huì )被當做采集站直接被百度處理掉,百度新的綠蘿算法就是專(zhuān)門(mén)打擊采集站點(diǎn)的。
3、網(wǎng)站的固定版塊出現次數太多,很多網(wǎng)站的右側總是固定放一些版塊或欄目,這些欄目的內容從來(lái)不進(jìn)行更新,或者各個(gè)頁(yè)面的右側都是前篇一律的內容,就會(huì )造成頁(yè)面重復度高。
4、未設置404錯誤頁(yè)面,當我們刪除某一個(gè)頁(yè)面的時(shí)候,一定要用404狀態(tài)碼給予用戶(hù)和蜘蛛一定的提示,如果代碼設置錯誤,那么刪除的頁(yè)面在蜘蛛那里是假想存在的,由此一來(lái)就會(huì )多次收錄。
5、動(dòng)態(tài)頁(yè)面和靜態(tài)并存,百度爬去目錄時(shí)收錄了大量動(dòng)態(tài)頁(yè)面
6、網(wǎng)站內容以圖片為主,文字很少,很多圖片都是共用一個(gè)URL地址,這樣一來(lái)蜘蛛在索引的時(shí)候很難保證不被重復收錄。
重復內容是指不同的URL鏈接內容卻是相同的,同時(shí)收錄多個(gè)重復頁(yè)面,設置多個(gè)頁(yè)面進(jìn)行介紹,但是網(wǎng)頁(yè)的大體內容是相同的,這樣處理的方法是錯誤的。
二、重復內容的檢測方法
1、對于檢測一篇文章是否重復內容,title:+文章標題可找出相同的文章。
2、從文中摘取一段話(huà),在百度搜一下,出現大量紅字,表明這篇文章的重復度高
3、站內搜索,可以找到出現多次的內容。
4、利用一些頁(yè)面相似度檢查工具,判斷一些相鄰頁(yè)面的相似度,80%以上相似度就需要對一些固定欄目進(jìn)行處理。
三、如何消除重復內容
1、原創(chuàng )內容的增加
對于網(wǎng)站內容多為采集或簡(jiǎn)單偽原創(chuàng )的網(wǎng)站,企贏(yíng)001建議增加原創(chuàng )文章的內容,寧可百度收錄少一些,也不要讓百度把之前收錄的文章吐出來(lái)。
2、網(wǎng)站固定欄目?jì)热蓦S機展示
可以根據正文的關(guān)鍵詞,隨機調用右側欄目的文章內容,讓每一個(gè)頁(yè)面都有不一樣的內容,避免大量頁(yè)面相似度高的情況出現。
3、設置404頁(yè)面
告知用戶(hù)和搜索引擎某些頁(yè)面不存在了,防止搜索引擎收錄大量死鏈。
4、頁(yè)面設置獨立的Meta標簽
關(guān)鍵詞、標簽、描述,每一個(gè)頁(yè)面都需要不同,可以采用手動(dòng)修改,或者根據一定的規則設置。
當你的網(wǎng)站內容重復率并不高的時(shí)候,百度是不會(huì )惡意對網(wǎng)站進(jìn)行懲罰,除非競爭對手對網(wǎng)站惡意破壞,為了避免網(wǎng)站被K站的坑,我們需要先檢測網(wǎng)站的重復問(wèn)題,以免給網(wǎng)站后期的維護帶來(lái)不必要的麻煩。