I/O 2023大会AI唱主角，谷歌携PaLM2迎接大模型“背水一战”

北京时间今日凌晨，谷歌I/O全球开发者大会在加州山景城举行，与往年I/O大会安卓系统唱主角不同，今年的I/O大会是一场以AI为核心的大会，谷歌展现了一系列人工智能领域的最新技术成果。

谷歌母公司Alphabet CEO桑达尔·皮查伊（Sundar Pichai）表示：“我们正在重新塑造包括搜索在内的所有核心产品。”

在大会上，谷歌在今年的I/O大会上发布了多款基于其大型语言模型（LLM）的新产品。同时，谷歌正在将生成式AI整合到搜索引擎和其他产品中，例如可以生成草稿信息的Gmail，以及可以对图像进行重大修改的Google Photos。

大语言模型PaLM2亮相，实现端侧大模型

大模型作为目前人工智能行业的焦点，谷歌在 I/O 开发者大会上宣布了全新的大语言模型 PaLM 2，据悉，PaLM 2是谷歌去年4月发布的PaLM语言模型的升级版本，它将为谷歌的更新版Gmail和 Bard 聊天工具提供支持，以挑战OpenAI的GPT-4。

据谷歌介绍，PaLM 2 在训练过程中使用了大量的数学和科学数据集，在逻辑和推理方面进行了广泛的训练，相比于去年的 PaLM 模型，PaLM 2 在多语言处理、推理和编码能力上有了显著的提升，并且接受了多语言文本训练，支持超过100种语言。

谷歌没有透露 PaLM 2 的具体参数规模，只是提到 PaLM 2 是基于最新的 JAX 和 TPU v4 计算设施构建的。谷歌对 PaLM 2 进行了算法优化，使得它在体积上比 PaLM 要小，但整体性能更强，计算效率更高。

在介绍环节，谷歌也不忘对标一下“竞争对手” ，谷歌官方测试显示，PaLM 2 的部分结果（例如数学）比 GPT-4 还要优秀。

据悉，为了让模型的能力更灵活地服务于产品，PaLM 2分为四种规格，从小到大依次为Gecko、Otter、Bison和Unicorn，其中体积最小的Gecko可在移动设备上使用，每秒大约可处理20个Token，开发者们不用花费大量的时间和资源来创建和调整PaLM 2，而是能够直接拿来就用进行部署。

基于PaLM 2 微调，谷歌还展示了一种名为 Med-PaLM 的多模态大语言模型，专门用于医疗领域。它可以根据 X 光片诊断病人的伤情，据称是首个在美国医疗执照考试中达到专家水平的大语言模型。

另一种是 Sec-PaLM 2，它是针对网络安全的大语言模型，它可以分析和解释潜在的恶意脚本，并评估其危险性。

谷歌表示，目前已有超过25个产品和App正在使用PaLM 2的能力。

Duet AI发布，全面对标微软Copilot

Duet AI 是 Google Workspace 的最新工具，是谷歌在Workspace应用中提供的一系列AI工具的品牌名称，利用谷歌AI 技术提供智能辅助：

首先，Gmail移动应用现在将根据一个提示，在一个新的“Help me write（帮我写）”功能中为你草拟完整的电子邮件回复。此外，Gmail移动应用很快将增加上下文辅助功能，“让你能够创建自动填充姓名和其他相关信息的专业回复。”

Duet AI也出现在Google Slides中，与Midjourney或DALL-E 2类似，Duet AI现在可以将简单的文本提示（输入到Duet AI“Sidekick”侧边栏中）转换为AI生成的图像，以增强Slides演示文稿。它可以帮助您省去在互联网上寻找合适的幻灯片图像的麻烦，同时为它们增添一些原创性。基于此功能，Duet AI还可以在Google Meet中可以根据文本提示为视频通话生成自定义背景图像。

在Google Sheets中，Duet AI可以理解单元格数据的上下文，并相应地进行标记。电子表格应用程序还添加了一个新的“help me organize”（帮我整理）”功能，用于创建自定义计划。

Duet AI还在Google Docs的智能画布中增加了一个“assisted writing experience（辅助写作体验）”。输入一个描述你想写的内容的提示，就会生成一个Docs草稿。

此外Duet AI还增加了一套基于机器学习的Google Cloud开发者工具，它可以提供实时代码协助，并推荐生成的代码块，同时指出错误可，支持 Go、Java、Javascript、Python 和 SQL 等多种开发语言。

用AI重新定义搜索能力

会上，谷歌搜索也推出了全新的SEG（Search Generative Experience），在使用时会在一些查询的搜索结果的最顶部看到AI生成的答案，这些答案可以为你的搜索提供更多的上下文。你可以通过后续问题来缩小快照中的信息。这些AI快照是由Google在I/O上宣布的大型语言模型（LLM）的更新版本PaLM 2驱动的。这个新模型已经为25个谷歌服务提供支持，包括公司的Bard聊天机器人，并且在推理、编码和翻译方面有所改进。

更加多模态、多元化的Bard

谷歌宣布，旗下AI的聊天机器人Bard现在将对所有人开放，从周三起，向约180个国家开放申请使用Bard，并增加对韩语和日语的支持。同时该公司还增加了一系列新功能，让用户可以更容易地将生成的文本导出到Google文档和Gmail，加入了新的暗色模式和视觉搜索功能。谷歌还表示计划在未来为Bard添加更多功能，这包括使用Adobe的AI图像生成器Firefly的AI图像生成，以及与第三方服务如OpenTable和Instacart的集成。

面向AI的超算设施及学习工具

除了面向用户的功能升级外，谷歌还为开发者推出云端机器学习平台Vertex AI，增加了三款新的大模型：

Codey：text-to-code，可以帮助开发者编写代码；

Imagen：text-to-image，可以生成高品质的图片；

Chirp：speech-to-text，可以方便地进行语音转文字。

此外，在Vertex AI上还可以使用文本和图像的嵌入式API。它可以将文本和图像数据转换为多维数值向量、映射语义关系，从而让开发者创建出更加有趣的应用。

除了模型方面，谷歌云在训练上还推出了下一代A3 GPU超算。通过将A3虚拟机和Nvidia H100结合，谷歌云能够提供更大的计算吞吐量和带宽，能够让企业更快开发机器学习模型。

“亲儿子”独享AI赋能的安卓14

相比AI占据了发布会的绝大多数时间，昔日的主角Android 14则成为了这次大会的配角，且同样为安卓 14 系统引入两项生成式 AI 特性，包括 Magic Compose 和生成式壁纸，其中后者为Pixel 设备独占。

其中，Magic Compose可以在安卓系统的默认短信（Messages）应用中，通过AI 可以根据消息内容生成回复文本。

而生成式 AI 壁纸，则是通过引入文本转图片扩散模型，允许用户输入 prompts，描述想要获取的图片信息，系统将会自动生成相应的壁纸。谷歌还表示，它有一种新的“电影壁纸”（cinematic wallpaper），使用设备上的机器学习网络将你最喜欢的照片转换为 3D 图像，当你解锁或倾斜设备时，这些图像会呈现立体效果，给人栩栩如生的感觉。

除了软件方面的升级之外，本次I/O大会上，谷歌还发布了售价1799美元的首款折叠屏手机Pixel Fold、直板手机Pixel 7a以及平板产品Pixel Tablet，而这些谷歌“亲儿子”产品将和该系列其他产品一样，率先获得最新版的安卓大版本的升级，以及Pixel的独享功能。

回顾谷歌 I/O 2023大会，可以说是一场拥抱AI、拥抱的大模型的大会。面对席卷全球的热潮，谷歌作为全球的互联网科技巨头，也难以逆势而行。尤其是在OpenAI、微软、百度、商汤、科大讯飞等企业纷纷推出大模型以强化自身业务能力，实现效能提升，谷歌也必然有所行动，用AI赋能现有的产品，供自己的江湖地位。

在I/O大会上谷歌推出的新功能上，速途网能够看出谷歌已经向着大模型领域迈出了更加坚实的一步，而为谷歌形成真正的优势，不仅要看谷歌在这场大模型的角力中能否脱颖而出，还要看能否与产品与服务更加深度的整合，以合力打造一把“后中争先”的利刃。