垃圾邮件或火腿?
2009年5月13号的戴维布拉德利“ ” 请评论
一种新的垃圾邮件过滤可以使用您的网页浏览习惯,以帮助您的电子邮件程序过滤掉 垃圾邮件 并找到火腿。
计算机桌面系统,如下您的网页浏览习惯,然后使用此行为,过滤掉垃圾邮件从您的电子邮件是由研究人员在日本。
大树Takashita ,刚鸟,晃Kitasuka和正义Aritsugi部计算机科学与通信工程在熊本大学,说明该系统如何认定“火腿”字样的方式为基础的用户浏览网页和区分这些单词和火腿在“垃圾邮件”的话中找到用户的来信。 “该方法可减少麻烦维持一个垃圾邮件过滤器, ”研究人员说,这通常涉及用户证实了假阴性或黑名单特定垃圾邮件尚未筛选。
“我们的方法可以检测到一些垃圾邮件是很难划分正确使用现有的贝叶斯统计过滤器, ”我们的队伍说 : “我们表明 , 结合贝叶斯过滤器和我们的方法降低了一些虚假的底片。 ”
2001年,只有5 %的电子邮件流量在互联网上是不请自来的营销信息,称为“垃圾邮件”后,猪肉产品趋同而闻名的英国喜剧团队巨蟒在幽默歌曲题为“垃圾邮件,垃圾邮件,垃圾邮件... ”今天据估计, 90至95 %的 所有的电子邮件是垃圾邮件 或进行某种形式的恶意负载。 一些观察家认为,垃圾邮件可能 严重的环境后果 鉴于大量的计算机和用户的时间浪费在管理这样一个庞大的流量,互联网流量。
有两个主要的反垃圾邮件技术:发送端技术运作的最初阶段,其目的是防止恶意用户发送垃圾摆在首位。 鉴于大规模分布式性质的垃圾邮件的来源和存在的垃圾邮件,僵尸网络建造损害全球各地的计算机能够发送数以百万计的邮件每一天,这是最难以实施。
因此,垃圾邮件的管理通常是给使用接收方的技术,无论在经营水平电子邮件公司(如谷歌邮件) ,互联网服务提供商( ISP )或在用户的电子邮件程序。 为了提供一个新颖的办法,垃圾邮件控制, Takashita和他的同事把重点放在了后者:过滤。
有许多方法可用来过滤垃圾邮件。 最简单的涉及建立黑名单的垃圾邮件的话。 如果这些话是在传入的电子邮件是标记为垃圾邮件。 其他过滤器可能会寻找Web地址中嵌入传入的电子邮件,并指定的垃圾邮件标记,如果有超过某一阈值的网址数量的电子邮件,或者如果这些网址指向的网站列入黑名单,或以某种方式变得模糊不清。 这个URL过滤方法也有助于过滤钓鱼欺诈邮件太多。
在任何一个电子邮件用户可以手动旗帜的电子邮件为垃圾邮件或取消国旗火腿电子邮件。 贝叶斯统计数据已被用来提高和自动过滤的办法,这个“学习”从电子邮件黑名单或白名单哪些统计相结合的话在一个新的电子邮件可能会显示垃圾邮件或火腿。
有一件事最电子邮件用户也与他们的电脑浏览网页。 Takashita和他的同事们使用这一事实,以帮助开发一个过滤算法,提取用户的喜好的基础上他们的网页浏览习惯,适用于这种行为,以过滤掉垃圾邮件的结合传统的贝叶斯过滤电子邮件。 他们的做法引起任何隐私问题,因为它是完全客户端和浏览器的数据仅仅是美联储桌面工具。 必然将运行该工具,或内部Web浏览器和电子邮件程序。
该方法包括三个阶段:第一阶段创建一个火腿关键词列表浏览网页和适用的统计分析这个名单时,第二阶段提供了过滤功能 , 收到电子邮件火腿话清单,第三阶段,这是可选的,允许用户进行干预和白名单或黑名单的邮件已标记不正确。
在初步测试的办法,他们设法一半多的假否定过滤几千电子邮件与过滤测试,使用贝叶斯统计的。
这听起来都相当聪明,但我可以想像,一个迫切的问题用这个办法在这个有兴趣 访问某些小站点 提特别部位不一定会转化为希望阅读电子邮件关心的扩大表示身体部位。 或更严重的是,仅仅因为您所搜索的信息,特别是医疗障碍并不意味着你将要接收的电子邮件营销无止境您提供药物特定疾病。 我能想到的其他几个例子,在我的新闻浏览习惯可能会导致几乎没有被过滤的垃圾邮件在所有!
大树Takashita ,刚鸟,晃Kitasuka ,与正义Aritsugi ( 2008年) 。 提取用户偏好的网页浏览行为的垃圾邮件过滤诠释。 (2), 126-138学者先进情报模式, 1 ( 2 ) , 126-138


















0答复迄今↓
有什么补充? 请发表评论如下
发表评论