全面对标GPT-4Turbo?日日新5.0终于打破了大模型行业“瓶颈”

“这张海报就是由大模型生成的。”徐立说,“除了聚焦本身发布的参数之外,我们今年更多的关注了行业的场景落地,并以行业来驱动人工智能的爆发”。

4月23日,商汤技术交流日在上海临港正式开幕,延续着上一次的开场方式,商汤科技董事长兼CEO徐立,依然在正式介绍前展示出了一张幻灯片:海报呈漆面工艺风格,主要景物以山、树木等静态物质为主。据悉,此次商汤科技推出的是全新版本的「日日新5.0」。

图源:商汤科技

商汤科技董事长徐立强调:目前,日日新5.0大模型体系综合能力全面对标GPT-4,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。

高达200K的推理上下文窗口,日日新5.0全面对标GPT-4Turbo

2023年,AI浪潮来袭,商汤科技的大模型体系也在“大模型 + 大装置”的战略规划下,持续高效的进行着优化与升级。

自去年4月商汤「日日新 SenseNova」大模型体系正式问世以来,其已正式推出五个大版本迭代。而今,商汤新一代「日日新 SenseNova 5.0」时隔一年正式问世,对已有的多个大模型进行全方位升级外,还创造了一些「崭新的面孔」。

图源:商汤科技

据悉,基于超过10TBtokens训练、覆盖大量合成数据,升级后的“日日新SenseNova 5.0”采用混合专家架构,推理时上下文窗口可以有效到 200K 左右。同时,日日新5.0在自然语言能力(大量中文预料的构建)、综合推理(包括数字推理)、代码生成、多模态交互等整体表现上「更上一层楼」,全面对标GPT-4 Turbo ,并且常用的客观评测上达到或超GPT-4 Turbo系列模型。

首先,发布会上,商汤科技以“高考中红楼梦的相关撰文需求”展示了日日新5.0的答题能力。测试结果发现,日日新5.0不仅解题速度十分优秀,还摒弃了大模型最常应用的传统撰文套路,以发散的撰文思维及时下最热互联网“热点”完成了此次创作。

数学题目测试中,商汤科技选择了以“13个小朋友玩老鹰捉小鸡,捉住了5只小鸡外,还剩几只小鸡”为题干,让ChatGPT4.0及日日新5.0分别进行回答。测试结果显示,这两款大模型在答数学题的能力上差异显著。

可见,在数学能力方面,日日新5.0大模型面对逻辑谜题能够跳出坑位,给出解决方案。基于此,商汤科技董事长兼CEO徐立强调:“在很多情况下,如果说模行要有行业上的差异化,把行业化的数据,以及行业化数据背后的理解叠加,一定是形成一个差异化的竞争能力”。

其次,多模态方面,商汤科技以“一头老象在茂密的森林中”为命题测试了日日新5.0生图能力,并与行业内领先的一众“对手”进行对比,测试结果显示,这几款大模型在生图的能力上风格不同,各有千秋。

图源:商汤科技

而在以“人”为主的生图测试中,相较于之前,日日新5.0多模态的迭代能力有着十分明显的提升,在人物细节构造上(即凌乱的头发、复杂的皮肤纹理)都十分出色。反观其他“几个友商”都在皮肤及发型上有不同程度的模糊化加工。

在本质上将“合成与理解”放在一起的技术处理上,商汤科技以“未来派建筑,楼顶有一个白色陶瓷LOGO——Sensenova”为命题进行了测试。

从各家大模型的回复中,我们注意到,除日日新5.0外,对于文字嵌入建筑当中均有一定的缺失,包括文字的理解,及LOGO的摆放位置等等。

反观日日新5.0,除了完全理解“需求”外,甚至对于LOGO细节处的倒影,及水面波浪式的纹理都做出了具象化的处理。

再有,数据推理多模态能力上。商汤科技以长图嵌入数据分析为例,展示了图片文字拆分,图片文字理解,基于长图思考形成逻辑性回答的能力。

图源:商汤科技

值得注意的是,本次发布会的演示环节,依旧采取的现场直播演示,相较于上一个版本,日日新5.0的确在理解能力、逻辑能力以及数学能力的展示上更加全面及详细。

大模型之家认为,作为商汤「日日新SenseNova」大模型体系的通用基础模型,日日新5.0的大幅度升级使得人们在使用模型处理多样化语言任务时更高效、更准确,让国产大模型拥有了与 GPT-4 相媲美的使用体验。

同时,对于整个行业来说,未来基于此模型基础上开展的学术研究、技术创新、商业应用也有了更多机会。

推出企业级一体机,商汤朋友圈均有新动作

基础模型升级之外,基于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤科技推出了企业级一体机,主打高性价比、开箱即用、数据安全及国产化芯片全适用。

据悉,一体机为2-42架构(即商汤独创),可达到2P算力,256G显存及448GB/s的连接。可同时支持企业级千亿模型加速和知识检索硬件加速,实现本地化部署,即买即用,降低企业应用大模型的门槛。相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。

图源:商汤科技

此外,商汤科技还推出了创新的端云协同解决方案,该方案能够智能地判断并协同发挥端侧与云端各自的优势。在需要联网搜索或处理复杂场景时,该方案能够智能地将任务分流至云端处理,而在部分场景中,端侧处理的占比甚至超过了80%,从而大幅降低了推理成本,提高了整体效率。

值得注意的是,商汤科技日日新·端侧大语言模型的推理速度达到了业内最快水平。在中端平台上,该模型能够实现平均18.3字/s的生成速度,而在旗舰平台上更是高达78.3字/s,为用户提供了极速的语言处理能力。

而商汤科技的扩散模型,同样在端侧展现了业内最快的推理速度。其端侧LDM-AI扩图技术在某主流平台上的推理速度小于1.5秒,相较于友商的云端应用,速度提升了惊人的10倍。更值得一提的是,该技术支持输出1200万像素及以上的高清图片,并允许用户在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能,为用户带来了极致的便捷和高效体验。

图源:商汤科技

而在自身应用方面,商汤“日日新SenseNova 5.0”在秒画、如影、格物、琼宇、大医、小浣熊家族等产品均有重要更新。

此外,在发布会中,商汤还邀请了金山办公、华为、小米、阅文集团等多位生态伙伴嘉宾,共同探讨和交流大模型技术在办公、金融、出行等不同领域的应用及前景。

金山办公方面,基于“日日新”大模型的卓越代码生成及工具调用能力,助力WPS365打造更高效释放场景能力的办公新质生产力平台,为企业构建专属的“企业大脑”。

海通证券方面,其携手商汤科技共同推出了金融行业专用的多模态全栈式大模型。这一合作不仅助力双方在智能客服、合规风控、代码辅助、展业办公助手等多个领域实现业务的实际应用,还共同深入研究了智能投顾、舆情监控等行业前沿场景,成功打通了证券行业大模型从研发到落地的全栈式能力。

小米则在旗下最新发布的SU7中应用了商汤的大模型技术,并基于商汤端云大模型解决方案,以小米小爱同学为车主提供智能化交互体验。

华为方面则宣布了与商汤联合发布面向金融、医疗、政务、代码等行业的大模型,并强调,双方将发挥各自在算力、数据、场景等方面优势,共建大模型生态,加速人工智能走深走实。

AI竞技,商汤底气何在?

值此商汤技术交流日之际,截至今日收盘,商汤科技股价上涨1.67%,报收0.61元/股,可见资本对于日日新大模型5.0的看好。

联想到实际业绩上,据3月26日商汤科技发布的2023年业绩报告显示:2023年公司整体营业收入34亿元人民币,其中生成式AI收入达12亿元,占集团总收入比例升至35%,实现近200%增长。这也是商汤成立十年以来,以最快速度实现从无到有,并取得超过10亿收入体量的新业务。

对此,商汤集团董事长兼CEO徐立博士曾公开表示,“生成式AI对商汤来说已不仅仅是技术领域的变革性创新,更成为公司的核心业务。商汤生成式AI业务的增长,得益于各行各业对大模型的训练和推理的广泛需求,这预示着中国硬科技投资的新周期正式开启。商汤通过在各业务层面深入融合生成式AI能力,正在赢得新客户,并推动效率和生产力的全面提升。”无疑,全新的 AI 2.0 时代下,商汤正加速转型变革,以通用人工智能(AGI)目标打造全新面貌的“商汤 2.0”。

眼下,AI赛道的战火已经燃烧到了行业场景的落地上。而能够引领大众欣赏世界的大模型,不仅为用户带来了更多的想象力,也为整个行业带来了更加具象化的商业应用憧憬。

在此背景下,为了在千行百业中用好它们,真正实现「行业场景落地」,一套完整的体系势必能让我们事半功倍。而从今日的技术交流日来看,在这一方面,商汤已经做好了准备。

(2)
上一篇 2024年4月23日 19:26
下一篇 2024年4月23日 21:17