与变异风险词赛跑 阿里探索AI治理网络风险

最近,阿里安全一线风控小二可粒发现,在禁售的风险防控库里,有人试图“上新”新品种,不法份子借助在社交媒体上走红的“魔法改运”等说辞,引人入玄学骗局。

尽量提前发现风险问题,提早布防是阿里安全风控部门的日常工作。“但是,风险对抗是不断升级的,各类风险词不断变异试图躲避各家平台管控,如果单靠人力防控,只会是杯水车薪。”可粒说。

针对类似具有行业共性的风险治理难题,业界和学界推动以技术创新探索网络风险治理。今年中国中文信息学会语言与知识计算专业委员会主办了“CCKS 2021通用百科知识图谱实体类型推断”比赛,邀请国内283支队伍参赛。12月25日,比赛结果出炉,阿里安全升级包含封建迷信、软色情、野生动植物保护、血腥暴力等重难点风险治理域在内的AI技术获得第一名。

图说:“CCKS 2021通用百科知识图谱实体类型推断”竞赛公布获奖情况

阿里安全高级风控专家杜衡介绍,阿里安全在平台部署了上述新升级的新一代安全架构核心AI能力,让AI对风险商品进行“联想”,以此对抗突发新增、变异的风险商品。此前阿里风控平台对多类风险商品出台了明确的管理规则,进行了禁售规范,今年绿网计划则针对相关风险词,上线了科普宣导。

虽然该AI技术在竞赛的公开数据集上获得了突出的成果,但据阿里安全反馈,技术应用在真实环境中遇到了更多难题。

阿里安全算法工程师科蓝解释,第一个难点是商家发现相关风险词被平台管控后,立马试图用新词代替,为了让AI的能力跟上变异的节奏,甚至提前布防,AI会基于风险防控经验以及公共新闻事件等,自动挖掘一些新词,并对这些词进行扩充解释,让AI系统理解这些词的真正含义和匹配的风险场景,最后候选风险词还要经过运营的人工校验。

“相当于你在跟一个不断易容、换衣服的人赛跑,他跑着跑着就换一层皮,你得找准对手,不停地往前跑。”科蓝说,目前依靠AI自动搜寻生产的非正常风险词汇,最终被人工运营审核后的采纳率为60%,逐步降低了人工寻找新风险词的成本,同时尽量提升覆盖更多风险区域的效率。

第二个难点是,除了风险词变异速度快,平台发现有些商家会以正常商品介绍的“外套”引导消费者到其他社交工具上进行沟通和成交。

“这种情况比较难以通过某种技术防控,一方面我们通过各种渠道向商家进行合规知识的宣导,一方面也希望互联网平台联合起来,针对此类风险共同探索合作治理机制。”杜衡说。

该AI目前升级覆盖到17个风险场景。阿里安全资深算法专家薛晖介绍,阿里安全在加大技术治理风险场景的投入,比如建立人工智能治理与可持续发展的新型实验室,与顶尖高校联合发起“安全AI挑战者计划”等项目,培养实战型AI人才。

“要强调的是,AI技术不是万能的,平台遇到各种风险变异与挑战也正说明,治理多类风险场景将是持续的博弈,但使用技术进行风险治理是其中一个发展方向,我们还在继续提升AI联想的准确率,希望依靠科技创新构建更清朗的平台环境,探索如何更好地解决大众遇到的网络安全风险问题。”薛晖说。

(0)
上一篇 2021年12月27日 16:44
下一篇 2021年12月27日 16:52