苹果App Store偷偷用AI做实验：搜索结果排名竟提升了！用户下载率暴涨0.24%

由 pony

在苹果新闻

阅读时间：1 分钟阅读

苹果研究团队在App Store进行了A/B测试，验证AI生成的关联度标签能否提升搜索排名和应用下载量。结果令人意外……

AI生成的相关性标签小幅提升App Store搜索转化率

在一项名为《Scaling Search Relevance: Augmenting App Store Ranking with LLM-Generated Judgments》的新研究中，苹果研究人员探索了大型语言模型（LLM）能否通过生成相关性标签来改善App Store的搜索结果质量。

正如研究中所说，相关性显然是帮助用户找到目标应用的关键。虽然搜索排名依赖多种信号，但研究团队主要聚焦于两大核心因素：

研究指出，虽然行为相关性标签数据非常丰富（因为可以轻松追踪用户行为），但文本相关性标签情况完全不同：

虽然行为相关性标签数量充足，但由人类评估员生成的文本相关性标签却极为稀缺。这造成了一个根本性难题：高质量文本相关性标签既昂贵又难以规模化生产，成为了多目标训练中文本相关性目标的瓶颈。

为了解决这一问题，研究团队基于已有的人类判断数据，对一个30亿参数的LLM进行了微调，使其学会根据用户搜索词和应用元数据自动打出相关性标签。

随后，他们用该模型生成了数百万条全新相关性标签，并将这些标签与原始数据结合，重新训练了App Store的排名系统。

完成训练后，他们先进行了离线评估，随后在全球真实App Store流量上开展了大规模A/B测试：

“（…）使用
llm-augmented
模型后，我们的核心指标——转化率（定义为至少下载一款应用的搜索会话占比）实现了统计显著的+0.24%提升。虽然数值看似微小，但在成熟的工业级排序系统中，这已被视为显著进步。该增益在89%的商店front中均有体现。”

换句话说，看到AI增强排名模型的搜索结果的用户，比使用传统排名模型的用户多0.24%的概率至少下载一款应用。

虽然0.24%听起来很小，但考虑到2025年App Store全年下载量预计约380亿次，这一微小提升就能转化为数千万次额外下载，对开发者而言无疑是重大利好。

欲阅读完整研究论文，请点击此处链接。