近段时间,越来越多的站长发现自己网站的统计后台有大量的垃圾广告,并且还有一些灰色词作为网站的搜索词进行网站被统计。
今天登录网站统计上看了下访客信息,黑灰产太猖獗了,持续不断地往我的百度统计 ID 内灌广告。虽然官方有做屏蔽处理,但是又没有从统计信息中把广告这部分数据剔除,造成访客数据严重失真,非常的不爽。
P1.百度统计后台大批量的广告信息
要怎么解决这个问题呢?黑灰产是通过挂国内代理刷广告的,而且不是真正的访问网站,只是往百度统计后台灌数据,举报和封禁ip地址都不太现实。那这些黑灰产是怎么精准知道往我的网站访客统计后台灌数据呢?原来,我们在网站 header.php 或者 footer.php 文件上添加百度、cnzz、51la 等访客统计 script 脚本时,脚本信息中携带了 ID 信息,黑灰产通过爬虫抓取到这些信息后再往它们的广告机器上添加,这样就难逃黑灰产的魔爪了。
知道原由后,我们就可以采取以下步骤彻底根治这个烦人的广告问题了:
网站统计后台每天有大量的垃圾广告,怎么去它进行有效的屏蔽呢?网上有很多人是采集统计后台的白名单或者屏蔽IP的方法,但这些方法效果都不明显,因为群发软件可以随意的变更域名和IP地址,是防不胜防的。
屏蔽垃圾广告应该在源头做起,由于这些垃圾广告群发软件需要先拿到网站的统计代码ID,如果我们能够做到让别人不能拿到或者不能轻易拿到统计ID的话,我们的网站统计后台就不会再收到群发广告了。
怎么却隐藏网站的统计ID呢?最简单快捷的方法就是将自己的统计代码进行JS加密压缩。
1、到第三方统计平台上删除当前网站,重新添加; //比较可惜的是历史访客信息都要清零了…
2、新的统计脚本代码通过 JS 代码混淆(../tools/jscodeconfusion.aspx),然后把混淆后生成的信息复制粘贴到原访客统计代码处。 // JS 代码混淆类似于给代码加密,混淆后黑灰产爬虫无法识别并抓取到 ID 信息。
P2.script 统计代码经过 JS代码混淆 处理,复制混淆后的代码到网站上使用
总之:通过这种统计代码加密的方式,可以一定程度上屏蔽网站统计后台的垃圾广告。并且这种方法适用于百度统计、站长统计、51LA统计等主流统计。