文心大模型如何保障安全防线？百度副总裁陈洋详解

速途网讯 12月21日，“云融未来，安全内在”第七届云安全联盟大中华区大会（CSA GCR Congress）在深圳圆满举办。百度副总裁陈洋出席大会并围绕“安全大模型”+“大模型安全”发表主题演讲。陈洋表示，大模型在加速产业升级与经济增长的同时，也为网络安全行业带来了全新的机遇与挑战。基于大模型，通过智能人机协同可以重构整个安全业务流程，大模型可以进化成为一种“生产力工具”。

人工智能是新一轮科技革命和产业变革的重要驱动力量，而大模型的兴起，使得人工智能应用的深度和广度进一步拓展。自百度3月发布知识增强大语言模型文心一言至今，文心一言的基础模型已迭代到文心大模型4.0版本，在理解、生成、逻辑、记忆四大基础能力上都有了显著提升。与会，陈洋分享了文心大模型应用在安全领域，在安全运营、内容审核、APP隐私合规检测、业务风控等多领域的AI原生应用构建思路与实践，助力大幅提升安全效率及能力。

陈洋表示，如何提升行业AI 原生安全应用研发的效率也非常关键。目前，基于百度领先的AI大模型平台，百度安全打造了百度AI安全底座，基于安全知识和技能强化的大模型和全场景的智能体，针对各类安全业务场景，以低代码的方式实现人机协同安全工作流，进而通过AI原生安全服务层，让各类的安全应用都可以进行AI原生化重构。

另一方面，大模型自身的安全、可信、可控变得至关重要，网络与系统安全、模型算法安全、数据安全和隐私保护、内容安全在大模型全生命周期中环环相扣，体系安全与内生安全将长期共存。

作为人工智能领军企业，百度高度重视大模型安全风险防范的能力建设和生态建设。基于百度大模型安全实践经验，百度安全从大模型全生命周期视角出发总结出一套从服务提供方视角的应对思路，方案涵盖大模型训练/精调/推理、大模型部署、大模型业务运营等关键阶段，提供全流程的包含数据安全与隐私保护、模型保护、内容安全、业务运营风控的安全产品与服务，同时结合以攻促防守的思路建立AIGC 内容安全评测能力，对大模型实现例行化的安全评估，助力企业构建平稳健康、可信可靠的大模型服务。

例如，在大模型运营阶段中，百度安全构建了包括红线知识库/红线大模型、prompt审核与改写、多模态内容审核、内容安全评测等一系列安全服务。针对违法犯罪、不良价值观等负面及高危红线问题，重点构建了“红线知识库和红线大模型”提供安全回复内容进行代答，并可对用户做出正向的引导。针对Prompt注入攻击，可在保持其初始指令和数据不变的基础上，通过改写Prompt的方式让大模型输出安全的内容。

作为云安全联盟CSA全球会员单位，百度长期以来致力于以更安全的AI护航产业发展，积极布局智能云计算的前沿技术探索与实践，持续深化“人工智能+云安全”的融合创新。与会，作为北京人工智能产业联盟人工智能安全专委会主任，陈洋代表专委会与CSA云安全联盟正式战略签约。未来，双方将发挥各自优势，在人工智能领域开展联合研究、共同前沿技术和应用领域的发展。

面对当下“大模型+安全”所面临的新形势、新机遇、新挑战，百度安全将一方面不断拓展人工智能技术在网络安全领域的技术革新与应用，一方面与各界保持合作，共筑大模型安全防线，探索更安全的大模型赋能千行百业的无限可能。