网站联盟防止作弊的常用方法

admin 发表于 [网站运营] 分类,标签: HTTP 知识总结 网站推广 点击欺诈
0

1、 IP防止作弊   
一般计费方式是按照24小时内唯一IP,可以将每个IP记入数据库,当下一个访问IP与数据库已存在的IP相同时,则不计费。现在上网一般是动态 IP,作弊者通过拨号器上下线来实现改变IP地址,你可以通过C段IP来辨别,如大量出现218.175.11.x这种相同C段的IP号,则可能作弊。可 以通过IP加密提交,然后由接收端进行解密记录入库,可以杜绝采用模拟提交数据的作弊方式。   

2、 COOKIES防止作弊    
当你访问过一个页面时,COOKIE并会记录,当你下一次访问该页面时,并会提交一个相同COOKIES参数,你可以判断重复的不计费。这种方式的缺 陷是很容易改变物理信息进行作弊,比如通过INTERNET选项清空COOKIES。   

3、 点击比率上线设置   
平均点击率从99年的5%下降到了1%以内,当然其中还需要广告面向对象与页面的访问者的交叉率,越高则表示该页面与广告的关联度越大,点击率越高。 目前富媒体广告的点击率在2%至5%,普通图片点击在0.1%至1%,与图片的创意有关,可以设置当点击率超过一定的百分率提示可能作弊行为。为了提高点 击率,最常见的创意方式是模拟WINDOWS系统提示、模拟关闭按钮以及美女激情诱惑性图片。   

4、 结合ALEXA数据防止作弊   
ALEXA虽然不是一个标准,但却是极好的参考工具,当一个ALEXA数值很大的站点却做了很高的点击量,就产生疑问了,流量从何而来?   

5、 来源统计防止作弊   
1、记录该点击的来路页面,即广告放置页面的地址,可以人工巡查广告放置是否正确,查看旁边是否有引导性不良语句。
2、记录放置广告页面的来路,每个 站点的搜索引擎来路总是占据很大的一个比例,如果该页面没有来路,可以判断这个页面的流量非连接流量,可以通过两种途径获得,一、浏览器直接访问或者收藏 夹访问;二、弹窗流量没有来路统计,也有可能是目前流行的流氓插件弹窗。该种方式也可以查询到有些站长将广告代码放置在IFRAME里的最终页面。   

6、 通过唯一参数防止作弊   
网卡MAC物理地址、硬盘序列号,通过该类软硬件信息生成机器码。这种方式的缺点是很难在WEB上应用,适合软件营销的防作弊方式。   

7、 时间顺差防止作弊    
当你打开一个有广告的页面时,一般情况下不可能瞬间点击广告,因为每个广告都由印象转变为关注,再转变成点击行动,你可以设置当访问者打开网站页面几 秒内点击广告为作弊行为。当几次广告点击的时间差完全一致时,也可以判断为机器人点击行为。当你打开一个广告,在几秒内立即关闭,也可以判断为无效点击。

8、 鼠标值   
1、显示屏幕上的每个点都具有一个坐标值,当你在某个点按下鼠标时,都会有一个坐标值,当采用机器人点击时,为同一个鼠标值,可以只记一次点击。   
2、每次点击都会产生鼠标的KEYUP 和KEYDOWN的行为,如果未能捕获到这个值,可能是模拟数据提交。

 

 ̄ ̄ ̄ ̄ ̄ ̄ ̄google adsense 防止欺骗点击的分析_______

随着在线广告的流行,pay by per click (每次点击付钱)的模式 逐渐被大家接受。可是随之而来的问题就是fraud clicking的预防迫在眉捷,因为这将直接关系到这种广告模式能否长久生存和能否成为一种真正的网站拥有者的收入来源。 下面介绍Google Adsense系统如何从系统角度出发防止点击欺骗,希望对其它的在线广告系统防止虚假点击能有很好的指导作用:

1] 点击率 = 点击次数/共浏览的次数。
点击率是一个判断是否有无fraud clicks的关键的方法,可以想像一个网站上的广告的点击率超过10%将意味这什么。

2] 点击覆盖率/独立IP ,这个分布里如果有:单个IP 的(点击/浏览)=点击覆盖率超出了3倍的系统误差范围内将有作弊的嫌疑。

例子, 例如来自 129.119.200.1 的用户浏览了 16个网页,点击了4个广告,而整个广告的点击率「从[1]里计算的到」是5%,那么计算得到:
例子,
5% X 16 =~ 1,方差为Sqrt(1) = 1,点击覆盖率=4/1 = 4 ,根据数学上高斯分布,这种概率小于万分之一。
点击率 X 单个IP的浏览次数

3] 点击率『点击覆盖率』/IP/时间
根据时间序列对点击率进行分析,如果在某一个时间段上有明显的峰值,那么这将以为着有潜在的欺骗点击的可能。


4] 网页load的时间和 广告点击时间差的分析,以及每两次click之间时间差序列的分析

[网页load的时间和 广告点击时间差] 应该是一个泊松分布 possion distribution,而每两次click之间的时间差也应该是一个Possion distribution,如果这个时间用秒记,大于25秒的话基本上呈现高斯分布的形状。


5] 针对Proxy点击的分析
改变IP进行点击可以说在以往是最难以解决、最难以发现的作弊方式,大概国人进行Alexa的Boost时就多半采用了Proxy进行虚假点击的方法,可是这里只要通过反向监查IP的来源是否是带有Proxy功能的服务器就可以知道了。


6] 针对 http_agent的分析  Http_agent/时间 的时间序列的分析,峰值超过3方差需要审查

7] 针对 http_referrer 的分析  referrer/时间 的时间序列的分析 ,峰值超过3方差需要审查

8] 整体效果上还有一个非常有用的量:
所有用户的有效的每千次展示费用的均值/独立IP
这个将能更加直接找到spam clicking 的运行计算机并且予以封杀。


即便我在这里给出了以上的防止作弊的办法,但是不要忘记了: 邪恶的人永远比正义的人来的多,来的猛烈。

发表我的评论