Update@2018-12-07 17:47:52

这货还在继续爬,估计脑子被驴踢了

换了一个Chrome48的马甲

数据中心的IP可还行?

前言

由于最近一直再折腾Single Sign-On,没时间打理博客,今天一看统计数据,真的好气

上图

出现大量用低版本“IE浏览器”+WindowsXP组合,还都是同一来源的用户





nginx我禁用了TLS1.0和TLS1.1,意味着IE11以下的用户是无法访问的
那么问题来了,对方伪装一个IE8的UA头要用来干啥呢?

浏览器统计报表

11月的时候我还没有受到这种侵害,可以看到IE的份额是非常低的

转瞬间来到了12月,IE的份额大幅上涨

不觉得很反常

操作系统统计报表

同样先上11月的图

再来看12月的图

WindowsXP超级反杀,份额占到了12%,要知道11月是没有WindowsXP的

来源网站统计报表

11月图

12月图

出现大量来自USELYS的访客,我不确定就是它的爬虫,还是别有用心之人栽赃嫁祸;从这个站来的90%+是IE+WindowsXP组合的用户,机缘巧合还是别有用心?

前端日志

由于我做了前后端分离,前端下挂了ModSecurity作为WAF,这两天同样很异常

出现了大量GET xmlrpc.php的http1.1请求,同样伪造了referer和x-forward-for标头

结语

由于时间不是很充足,只是看了统计的数据,nginx日志还没有分析,有时间在更
作为应对,我从昨天开始拉黑了部分IP,直接返还403处理;屏蔽了包含MSIE和Trident UA头的访问

所以你的爬虫好玩么?CC-NC-BY-SA 4.0协议允许你在遵守前提条件的情况下使用我的博文。你不打招呼,一大堆IP来爬,是不是有点过分了?虽然我的配置承受这样的流量问题不大,但是你不要太过分,搞一堆IP来爬

为保证良好的排版风格,请在搬运时使用 Markdown 版本,本文 Markdown 版本