The Information 发布了一篇重磅报告,披露了苹果与谷歌合作中许多令人关注的细节:Gemini 将成为苹果新一代 AI 功能(包括全新 Siri)的底层模型。以下是关键内容。
苹果独立精调、无任何 Google 或 Gemini 品牌
昨天苹果宣布采用 Gemini 作为 AI 功能底层模型的联合声明,几乎没有透露任何技术细节。
双方仅表示“基于 Gemini 的功能将继续在苹果设备和 Private Cloud Compute 上运行”,意味着谷歌按设计无法访问用户数据,仅此而已。
今天 The Information 带来了更劲爆的内幕,其中最重要的一点是:苹果将能够**独立精调 Gemini 模型**:
据参与项目的知情人士透露,苹果可以要求谷歌对 Gemini 模型的部分工作方式进行调整,但除此之外,苹果能够自行对 Gemini 进行精调,使其按照苹果希望的方式来回答用户问题。
报告同时也部分解答了很多人关心的问题——整个体验中 Google 的品牌痕迹到底会有多明显:
据该知情人士表示,在苹果当前基于 Gemini 的系统原型中,AI 的回答完全不带有任何与 Google 或 Gemini 相关的品牌标识。
虽然最终体验可能与当前原型有所不同,但这与去年末马克・古尔曼(Mark Gurman)在 Bloomberg 的报道基本吻合:
我不认为两家公司会公开谈论这项合作,你也不要指望 Siri 会充斥 Google 服务或安卓上已有的 Gemini 功能。这仅仅意味着 Siri 将由一个真正能提供用户期待的 AI 能力的模型驱动——而界面完全是苹果风格。
The Information 还提到,苹果期待 Gemini 驱动的 Siri 在世界知识类问题上表现更好,能**直接给出答案**(如描述某国人口数量或科学知识),而不是只给一堆链接让用户自己去看。
Gemini 版 Siri 将大幅提升情感支持能力
报告还指出,苹果希望 Gemini 驱动的 Siri 在情感支持方面有显著进步:
“Siri 历史上最常答不好的问题类型之一就是情感支持,例如用户告诉语音助手自己感到孤独或沮丧。在基于 Gemini 的版本中,Siri 将像 ChatGPT 和 Gemini 那样,给出更完整、更具对话感的回应。”该知情人士表示。
将情感支持列为目标存在一定风险,因为已有大量案例显示,脆弱用户在与聊天机器人对话后伤害了自己。
许多时候,这些系统不但没有提供适当的安全引导或建议寻求现实帮助,反而产生幻觉、误判情况或未能理解对话的严重性,有时甚至导致严重后果。
Gemini 版 Siri 面对这类不可避免的场景到底会如何应对,仍有待观察。
关于两种不同系统的融合
去年八月,在公司全体会议上,苹果软件主管 Craig Federighi 谈到了 Siri 大改版遇到的最大难点之一。
当时 Bloomberg 报道称:
Federighi 解释说,问题出在试图同时推出两种不同系统的融合版本:一套用于处理现有指令(例如设置计时器)的系统,另一套则是基于大语言模型的生成式 AI 系统。“我们最初想做混合架构,但后来发现这种方式无法达到苹果的品质标准。”Federighi 表示。
虽然 The Information 的报道没有深入技术细节,但也提到以下内容:
一些常见的 Siri 任务,如设置计时器、提醒事项或给指定联系人发特定短信,仍将由设备本地的技术驱动。而新版 Siri 还能处理用户问题表述不明确的情况。
举例来说,如果有人让 Siri “给妈妈”或“给姐姐”发短信,但通讯录里没有这样保存的名字,基于 Gemini 的 Siri 就会去翻看聊天记录,推测出哪位联系人最可能是“妈妈”或“姐姐”。
换句话说,苹果仍然在努力把传统的、低风险的自然语言处理任务(设置计时器、简单提醒等)与更复杂、不确定的生成式任务融合成流畅统一的体验——从用户体验角度看,这是正确的方向。
但这个看似简单的目标,对谷歌和亚马逊来说都极具挑战性。所以这项合作的实际落地过程值得持续关注。
发布时间表
最后,报道也再次确认:苹果基于 Gemini 的 AI 功能将**逐步推出**:
部分功能将于今年春季上线。其余功能,包括 Siri 记住与用户过往对话的能力,以及根据苹果日历中即将到来的机场接机行程,主动建议提前出门避开交通高峰等前瞻性功能,预计将在六月的全球开发者大会上公布,该知情人士表示。
完整报道可点击这里阅读 The Information 原文章。















