除了让用户在 Mac 上本地运行 Gemma 模型的 Google AI Edge Gallery 之外,谷歌还发布了 Gemma 4 12B 模型和适用于 Mac 的 Google AI Edge Eloquent 听写应用。以下是详细内容。
一点背景知识
大多数日常使用大语言模型的用户倾向于使用 ChatGPT、Claude 或 Gemini,这些都是基于云端的模型,运行在 OpenAI、Anthropic 和谷歌的服务器上。
与大语言模型交互的另一种方式是使用本地模型。这些模型通常比云端运行的万亿参数模型小得多,能力也较弱,但它们也带来了多项优势。
首先,比云端模型能力弱并不意味着它们不好。而且,它们不需要活跃的互联网连接,因为它们运行在电脑自身的处理能力上。此外,电脑性能越好,响应速度就越快,能处理的模型也越大。最后,由于一切都在本地运行,这些模型也更加私密,因为对话数据无需离开设备。
在 Mac 上安装本地模型有几种方法,我们之前在 OpenAI 发布自家开源模型时介绍过。但简单来说,你需要安装 Ollama 和 LM Studio 等平台,然后安装能够在你的 Mac 硬件上流畅运行的模型。
Hugging Face 托管了数千个开源模型可供选择,包括来自前沿实验室的模型。不过,Ollama 和 LM Studio 等平台也提供了直接从它们安装这些模型的方式。
这就引出了 Google AI Edge Gallery,这是谷歌用于本地运行 AI 模型的平台。谷歌之前已经为 Android 和 iOS 提供了 Google AI Edge Gallery 应用,但今天该公司也为 macOS 发布了它。
Google AI Edge Gallery 和 Gemma 4 12B
首先需要注意的一点是,与允许用户安装任何与其硬件兼容的 AI 模型的 Ollama 和 LM Studio 不同,适用于 Mac 的 Google AI Edge Gallery 目前仅提供对谷歌自家 5 个模型的访问,其中“it”代表 instruct,意味着它们可以被调整以遵循用户指令,而不仅仅是完成文本:
- Gemma-4-12B-it
- Gemma-4-E2B-it
- Gemma-4-E4B-it
- Gemma-3n-E2B-it
- Gemma-3n-E4B-it
列表中的第一个项目特别值得注意。Gemma 4 12B 今天发布,据谷歌称,它旨在将智能体、多模态智能直接带到你的笔记本电脑上。
虽然前沿 AI 实验室面向消费者的本地模型大多参数量在 20 亿到 90 亿之间,但谷歌表示 Gemma 4 的 120 亿参数设计提供了与其 260 亿参数混合专家模型相当的性能,同时“足够小,可以在配备 16GB RAM 的消费级笔记本电脑上本地运行”。
Gemma 4 12B 也是多模态的,这意味着它可以处理文本、视觉和音频。谷歌表示,该模型还具备良好的编码能力,“让你直接在设备上从数据中提取有意义的洞见”。
你可以在这里了解更多关于 Google AI Edge Gallery 的信息,并在这里了解更多关于 Gemma 4 12B 的信息。
Google AI Edge Eloquent
除了 Gemma 4 12B 和 macOS 版 Google AI Edge Gallery 的发布之外,谷歌今天还推出了适用于 Mac 的 Google AI Edge Eloquent 应用,此前几个月该应用已登陆 iOS。
Google AI Edge Eloquent 是一款免费的听写应用,它能捕捉用户所说的话并进行转录,同时润色文本、去除不流畅的部分,并进行轻微编辑以提升清晰度和流畅性。处理过程在设备上完成,而非云端。
该应用还允许用户在不同写作风格之间选择,并添加自定义词语,例如姓名、术语和其他常用词汇。这有助于避免听写应用在特定词语和短语上频繁出现的错误修正。
你可以在这里了解更多关于 Google AI Edge Eloquent 的信息。

















