搜索引擎的垃圾邮件发送者是什么样子?
你可能认为搜索引擎的垃圾邮件看起来几乎跟别人一样,这可能是真的,当然,除非你是一个垃圾邮件检测算法。
在最后几周ACM SIGIR会议在荷兰的一个有趣的论文提交了题为“了解你的邻居:利用网络拓扑网络垃圾邮件检测”。
本质上这描述了一个垃圾邮件检测系统,它使用的网页链接结构和内容,以确定垃圾邮件。或所言:“在本文中,我们提出了一个垃圾邮件检测系统,它使用的是利用网页之间的链接依赖的Web图形拓扑结构,以及自己的网页内容摘要。
下面的图中出现令人印象深刻的文件:
这是一个图形化描述与超过100之间的关联连接域(一个网页的一小部分),黑色和白色垃圾节点节点非垃圾邮件。
大部分的垃圾邮件发送者聚集在一起,在上层的中心部分的权利,这里是一个放大的那款的看法:
在其他领域都是由于垃圾邮件集群和非垃圾邮件集群。下面是一个典型的垃圾邮件集群和它显示了垃圾邮件,谁搞裙带关系连结,可能看起来像一个垃圾邮件检测算法。
当然这只是其中的研究路线到的垃圾邮件检测,但你并不需要千里眼知道,各大搜索引擎已经包括在一段时间内他们的排名算法类似的组件。好的搜索引擎优化避免非自然的连接方式和所有的网站所有者,宜这样做。
你可以在这里阅读全文:知道你的邻居:网络垃圾邮件检测利用网络拓扑,卡洛斯卡斯蒂略,德博拉多纳托,阿里斯蒂德Gionis,凡妮莎默多克和Fabrizio西尔维斯特里,对SIGIR,ACM出版,2007年7月,阿姆斯特丹,荷兰,423诉讼-430。
还有一个由卡洛斯卡斯蒂略很好的演讲,让一成的垃圾邮件检测各种技术的见解。记录在车间:网络搜索的未来,2006年5月19日雅虎研究院主办的巴塞罗那和技术,Universitat Pompeu法布拉署网站研究小组。你可以看到这里的演讲:使用等级的传播和概率基于链接的垃圾邮件检测计数。
(责任编辑:卓想动画http://www.zxgzs.com)