近日,ChatGPT在互联网上掀起了一阵热潮,目前月活用户超过 1 亿,注册用户之多导致服务器一度爆满。
人工智能的话题遍地可见,如“ChatGPT会取代哪些行业?”、“ChatGPT的实现原理”、“ChatGPT的玩转攻略”等等,众说纷纭,那么对于邮件安全行业而言,人工智能又带来了哪些改变?
3月23日,Coremail邮件安全人工智能实验室首席架构师潘庆峰(下文简称“大P”)在直播间进行了深度分享,作为中国电子邮件元老级技术专家,20年以来长期深耕于智能算法在邮件安全领域的应用实践,从目前大火的AI热潮中,他看到了哪些挑战与机会呢?
当前AI技术对邮件安全对抗的影响
当前 AI技术当前最热门的话题是ChatGPT和GPT-4了,通过体验ChatGPT, 人们惊叹于当前的深度学习模型已经能达到的水平。
大P认为,实际上,ChatGPT完成了两个任务,那就是语义分析和文本生成任务。
首先,如果把ChatGPT模型比作一个由大量数据训练而成的高维空间迷宫,通过读取每一个字符来决定下一步走向,最终我们可以抵达迷宫中的某个位置。
这个位置附近就是最可能的答案空间,从这个位置开始,按照最大可能性路径一个一个字地生成出答案,就是我们看到的ChatGPT回复。
因此,问题语义分析部分,就是Coremail反垃圾算法进行文本分类的基础。
实际正常邮件和垃圾邮件,它们都会集中聚类到高维空间的某个位置,我们会根据它们的空间位置来判断他们是否垃圾邮件。
大P认为,自然语言处理技术即将进入应用爆发期,主要会在邮件系统产业上形成三方面的应用。
第一,用户级层面上,邮件小助手应用AI自动生成回复或自动拟稿,甚至可以帮助撰写简单逻辑程序,由人工进行校验,提升工作效率。
第二,公司业务层面上,AI技术可以再读取大量公司文档后生成客服系统,与目前机械性的回复相比,后期的答疑质量将会大幅上升。
第三,对于垃圾邮件发送方而言,AI技术可能会被用来制作大量垃圾文本,形式内容不一但内涵一致,垃圾邮件的收发量有可能快速上升。
AI 既是矛,也是盾
尽管ChatGPT被用作开发勒索软件和钓鱼邮件开发已是板上钉钉,大P在直播间中也强调每一项技术都可以用于进攻或防守,不用太过担心深度学习技术会导致现有的反垃圾识别系统失效。
大P分析了三点原因:首先,生成大量垃圾文本远比文本分类需要大得多的运算量,普通黑产团伙很难提供这种量级的算力支撑。
其次,考虑到生成文本的可读性及逻辑性,此类文本必然带有很多有指向性的词语,词性相近文本在高维空间的位置都是相似的,这代表着使用文本分类进行反垃圾不会有太多的变化。
最后,反垃圾算法也不是单纯的文本分类问题,还可通过发信历史、发信行为、发信来源等多种特征协助判断。
AI赋能邮件安全-矛盾结合
黑产团伙乐于使用AI生成垃圾文本,那么对于防守方而言,我们同样可利用深度学习技术动态生成垃圾邮件内容,用来给反垃圾系统做陪练。
面对日新月异的垃圾内容,Coremail作为防守方以拦截垃圾内容为目标不断调整反垃圾模型,整个过程是机器自动完成,双方都能在此对抗过程中提高自己的效能。
科技向善,众行者远,是Coremail对于当前AI技术+邮件安全的乐观期望,我们也期待着在这场划时代技术巨变中,每个人在寻求商业机会的同时,也能为社会的进步作出相应的贡献,使得更多人收益。
与Coremail一同,期盼AI新未来。