明霞山资源网 Design By www.htccd.com

作为一个站长,略懂网站日志分析,网站会更安全。网站日志可以从ftp或服务器上面下载。下载后,我们可以通过相应的来源ip段进行分析,判别这ip段是否属于真实的蜘蛛。

下面小编就对笔者负责的站点日志进行分析。

第一、   小编从服务器上面下载了8-2网站日志

第二、   打开网站日志

站长略懂网站日志分析,网站将会更加安全

通过上图,我们可以看出,这里面很乱看得有点累,而且很难分析到底有哪些ip访问了我们的站点,哪些页面被蜘蛛捉取了。竟然很乱,那么我们可以简单的处理,让难变易。小编这里是通过txt格式转换成xls。这样我们就可以一行一列的进行分析。转换后,我们可以通过案列进行分列,这样就可以一列一列的详细的按规律来显示出来。

站长略懂网站日志分析,网站将会更加安全

通过上图,我们就可以清晰明了的分析客户ip来源了,具体哪些文章页面、哪个栏目被收录,我们都可以一眼明了,甚至还可也看出网站被爬取的状态。但从这里还是不能清晰的汇总出到底有哪几个ip段访问我们的站点。

至此,我们还要通过execl的数据筛选功能进行ip段类似的进行汇总,例如,220.181.108.121和220.181.108.78等c段之前都是一样的话,那么我们就可以通过c段相同的汇总在一起。具体操作,选择数据-自动筛选-自定义-包含-填写要归类一起的ip段。

站长略懂网站日志分析,网站将会更加安全

从这里,我们就可以直接的看出有哪些ip类型访问了我们的站点,那么我们就要了解这些ip类型是好还是坏。

作为站长要知道哪些ip段是好,哪些ip段是不好,这样就可以尽量的避免站点问题的持续衍生下去。通常的ip段解读

一 220.181.108.*ip段的百度蜘蛛(提权蜘蛛):

这个ip段访问你的站点,那么说明你的站点目前很健康,一天访问次数越多,说明百度蜘蛛对你的站点非常的友好。一经抓取的页面,被释放的时间非常短。 

二 123.125.71.*ip段的百度蜘蛛(劣质文章捉取蜘蛛):

这个ip段访问你的站点,那么说明你的文章质量不高,伪原创或者采集的相对比较高。虽然抓取了,可不会立马释放,释放时间比较久。出现越多者不好吧!

三 123.125.68.*ip段的百度蜘蛛(考察蜘蛛):

这ip段访问你的站点,一般是对于新站比较频繁,这ip段是考核蜘蛛,若对于老站经常出现这ip段的话,那么你的站点就有可能被降权,出现这情况,因立马对站点做修正处理。 

四 117.28.255.*ip段的百度蜘蛛(假冒蜘蛛):

这只其实是一只假的百度蜘蛛,至于他是什么蜘蛛我们也无从得知.。但我们有一个方法可以判断真假百度蜘蛛: 

点击桌面的“开始”图标-在搜索栏输入“CMD”-输入“nslookup”,

站长略懂网站日志分析,网站将会更加安全

输入后点击确定,然后再功能框里面输入ip地址,ip地址只能手动输入,不能黏贴。

出现下图所示为真实百度蜘蛛:

站长略懂网站日志分析,网站将会更加安全 

出现下图所示为真实冒牌蜘蛛:

站长略懂网站日志分析,网站将会更加安全

从上两图我们可以看出如果该ip地址是真的百度蜘蛛的话,那该就会显示“baidu”标识,如果没有看到“baidu”字样的服务器名就是假的百度ip。 

五 222.77.187.* ip段的百度蜘蛛:

这个ip段访问,说明你经常使用chinaz工具,这个ip段是chinaz模拟百度蜘蛛来访问我们站点的结果。 

网站日志分析,是作为一个站长每天必做的事情,对网站日志的分析要十二分的重视,切勿爱分析分析一下,不爱分析就都不管了。分析网站日志是一个站点长远发展的必经之路。好了,小编就对略懂网站日志分析,网站更安全介绍到此,欢迎高手留言交流!

尊重原创,注明出处,你就是在为互联网环境净化做出自己的一份努力。本文章由SEO皇冠网http://www.hg-seo.com/huangguanseo/99.html运营部编撰发布,文章首发皇冠营销网 - 关注SEO,SEM优化发展趋势分享营销推广技巧博客,原创文章,转载请留原创链接,谢谢配合~

标签:

明霞山资源网 Design By www.htccd.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
明霞山资源网 Design By www.htccd.com