导读 Google 开发了一种名为 RETVec 的文本矢量化器,可将 Gmail 中的垃圾邮件检测提高 38%,并减少误报和漏报。RETVec 是 Gmail 多年...
Google 开发了一种名为 RETVec 的文本矢量化器,可将 Gmail 中的垃圾邮件检测提高 38%,并减少误报和漏报。
RETVec 是 Gmail 多年来最大的防御升级,适用于所有语言和字符,使其适合大规模文本分类。
RETVec 可以部署在移动设备、边缘设备和网络上,并且它是开源的,代码可在 GitHub 上供用户访问。
Google 不断研究如何减少客户在 Gmail 收件箱中收到的垃圾邮件。几个月前,它迫使批量发件人验证他们的电子邮件地址,并且必须在批量电子邮件中包含“取消订阅”按钮。现在,它概述了一些更技术性的方法来对抗 Gmail 中的垃圾邮件。
据Ars Technica报道,谷歌最近详细介绍了其通过更好的文本分类方法打击 Gmail 中的垃圾邮件的努力。恶意行为者目前采用多种技术(例如关键字填充、隐形字符等)来绕过垃圾邮件检测防御,例如基于机器学习算法的文本分类器。为了解决这个问题,谷歌开发了一种名为 RETVec 的文本矢量化器,它可以跨多种语言工作。