今年早些时候,彭博社报道称苹果计划将严重延期的全新Siri模型托管在谷歌服务器上,而不是使用自家Private Cloud Compute。今天上午The Information也发布了类似报道,称谷歌已被委派在其数据中心内运行Siri服务器,同时必须严格遵守苹果的隐私标准。
The Information进一步详细说明了Private Cloud Compute为何难以胜任。除了算力不足外,该系统目前还严重利用不足,平均仅使用约10%的容量,导致大量已经生产完成的苹果服务器只能闲置在仓库货架上。
报道指出,苹果的云基础设施极为碎片化。不同团队的技术各自独立运行,而不是形成一个公司内部任何部门都能调用的统一资源池。
这种架构导致效率低下:公司某些部分的算力资源长期闲置,而其他部分却因无法访问这些资源而捉襟见肘。据悉苹果财务团队对这种重复建设的基础设施成本感到非常不满,但同时也不愿投入数十亿美元对整个技术栈进行彻底改造。过去十年里,公司内部曾多次尝试统一基础设施,但这些项目均多次搁浅。
具体到Private Cloud Compute,该系统被形容为“算力不足且麻烦大于价值”。软件更新过程复杂且耗时,更根本的问题在于其芯片(目前据信采用的是改装版M2 Ultra处理器)性能不足以运行像Gemini这样最新的前沿模型,而全新Siri正是基于此类模型打造。
由于首批Apple Intelligence功能的使用量远低于苹果预期,Private Cloud Compute的大规模建设目前被视为负面典型。虽然苹果预计全新Siri聊天机器人功能正式上线后需求将大幅增长,但目前的Private Cloud Compute架构显然无法支撑这一需求。
因此,苹果正与谷歌进行深入谈判,计划将新版Siri转移到谷歌数据中心运行。谷歌凭借Gemini项目已在海量大模型服务器部署方面积累了丰富经验。实际上,苹果早已将部分iCloud功能(例如云存储)托管在谷歌云上。
AI领域瞬息万变的格局,或许已迫使苹果高层改变对云基础设施的策略,未来可能加大自研投入力度,但真正落实这些改变仍需相当长的周期。
完整报道可查看The Information原文。



















