什么是網(wǎng)站日志?
保存于網(wǎng)站空間內的一種文本文件,用來(lái)記錄網(wǎng)站運行狀態(tài)的各種數據,通常是在網(wǎng)站運行的過(guò)程中,由服務(wù)器程序實(shí)時(shí)更新記錄。
常見(jiàn)的網(wǎng)站日志程序片段:
網(wǎng)站日志分類(lèi):
網(wǎng)站日志與網(wǎng)站的服務(wù)器程序密不可分,不同的服務(wù)器程序在生成網(wǎng)站日志時(shí)方法相差相大。
互聯(lián)網(wǎng)上常見(jiàn)的服務(wù)器程序有:
Apache 49%,
IIS 20% ,
Lighttpd 4%
本文檔側重于IIS與Apache服務(wù)器的日志說(shuō)明。
日志分析與流量軟件分析的差別:
從SEO的角度來(lái)說(shuō),兩者的相同點(diǎn):
日志分析和流量軟件分析都能分析出網(wǎng)站各種流量、受訪(fǎng)頁(yè)情況、關(guān)鍵字數據等
不同點(diǎn):
日志分析往往不能分析當前的流量數據;
常見(jiàn)的流量分析軟件不能分析出搜索引擎爬蟲(chóng)數據;
常見(jiàn)的流量分析軟件不會(huì )分析錯誤鏈接等數據;
網(wǎng)站日志研究對于SEO的作用:
1、了解搜索引擎抓取網(wǎng)頁(yè)的問(wèn)題:
分析搜索引擎爬蟲(chóng)訪(fǎng)問(wèn)情況,我們可以分析出搜索引擎收錄網(wǎng)頁(yè)的一些線(xiàn)索:
搜索引擎最近訪(fǎng)問(wèn)網(wǎng)站的頻率是否正常?
搜索引擎比較喜歡訪(fǎng)問(wèn)哪部分網(wǎng)頁(yè)?
搜索引擎很少訪(fǎng)問(wèn)哪部分的網(wǎng)頁(yè)?
搜索引擎是否訪(fǎng)問(wèn)了一些我們禁止訪(fǎng)問(wèn)的內容?
2、了解網(wǎng)站內容及鏈接是否正常:
通過(guò)分析服務(wù)器返回的狀態(tài)代碼,可分析以下問(wèn)題:
是否有死鏈接?
是否有頁(yè)面元素被誤刪,比如圖片、css腳本等等?
服務(wù)器是否曾出現暫時(shí)故障?
是否有臨時(shí)重定向?
是否有權限控制導致搜索引擎無(wú)法抓取數據?
網(wǎng)站日志研究對于網(wǎng)站安全的作用:
1、了解網(wǎng)站被盜鏈的情況
如果有第三方網(wǎng)站調用我們網(wǎng)站的圖片、視頻或者網(wǎng)頁(yè)文件,將會(huì )浪費我們的服務(wù)器資源,通過(guò)對日志的研究,可以很快發(fā)現這種問(wèn)題。
2、可初步分析網(wǎng)站是否被黑客植入程序
如果黑客利用網(wǎng)站程序的一些BUG,通過(guò)植入代碼的進(jìn)行進(jìn)行攻擊破解的話(huà),通過(guò)日志分析就有可能找到這種痕跡。
3、可初步分析是否有程序在大量抓取數據
搜索引擎或者第三方網(wǎng)站如果使用采集程序,大量反復采集我方網(wǎng)站數據,既會(huì )對服務(wù)器性能造成嚴重影響,而且會(huì )讓我們的資料流轉到其它網(wǎng)站上。
通過(guò)分析日志數據,可以讓我們發(fā)現這種采集現象。
關(guān)于網(wǎng)站日志分析的總結:
一般地,網(wǎng)站流量主要采用流量統計軟件來(lái)統計,而網(wǎng)站的故障分析、搜索引擎爬蟲(chóng)規律研究則通過(guò)日志軟件來(lái)分析;
如果我們能夠持續對網(wǎng)站日志進(jìn)行分析,就可以幫助我們在網(wǎng)站出現問(wèn)題的短時(shí)間內了解到問(wèn)題出在什么地方,并盡快找到解決方案。