麦克豌豆 MacPea.com
没有结果
查看所有结果
  • 登录
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
  • 麦壳软件
会员计划
现在订阅
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
  • 麦壳软件
没有结果
查看所有结果
麦克豌豆 MacPea.com
没有结果
查看所有结果
Home 苹果新闻

苹果展示M5芯片运行本地大模型相比M4速度提升显著

pony的头像 由 pony
2025年11月21日
在 苹果新闻
阅读时间:1 分钟阅读
A A
0

苹果机器学习研究博客上的一篇新文章展示了,在运行本地大语言模型时,M5苹果芯片相比M4有了多大提升。详情如下。

你可能喜欢

重磅!Apple TV《棕榈皇家》两季后遭砍,无缘第三季

iPhone 17e全新壁纸免费下载!超清提取版抢先get

免费Claude用户狂喜!现在也能用记忆功能,还能直接吸走竞品全部上下文

背景信息

几年前,苹果发布了MLX,该公司将其描述为“一个用于在苹果芯片上进行高效灵活机器学习的数组框架”。

实际上,MLX是一个开源框架,借助AI领域熟悉的API和接口,帮助开发者在他们的苹果芯片Mac上原生构建和运行机器学习模型。

以下是苹果对MLX的进一步说明:

MLX是一个开源数组框架,高效、灵活,并针对苹果芯片进行了深度优化。您可以将MLX用于从数值模拟、科学计算到机器学习的各种应用。MLX内置了对神经网络训练和推理的支持,包括文本和图像生成。MLX使得在苹果芯片设备上使用大语言模型生成文本或进行微调变得容易。

MLX利用了苹果芯片的统一内存架构。MLX中的操作可以在CPU或GPU上运行,而无需移动内存。其API紧密遵循NumPy,既熟悉又灵活。MLX还提供了更高级别的神经网络和优化器包,以及用于自动微分和图优化的函数变换。

目前可用的MLX包之一是MLX LM,旨在用于在苹果芯片Mac上生成文本和微调语言模型。

通过MLX LM,开发者和用户可以下载Hugging Face上的大多数模型,并在本地运行它们。

该框架甚至支持量化,这是一种压缩方法,可以使大模型在占用更少内存的情况下运行。这带来了更快的推理速度,推理基本上是指模型对输入或提示生成答案的步骤。

M5 对比 M4

在其博客文章中,苹果展示了新款M5芯片在推理性能上的提升,这得益于芯片全新的GPU神经引擎,苹果称其“提供了专用的矩阵乘法运算,这对许多机器学习工作负载至关重要。”

为了说明性能提升,苹果比较了在搭载M4和M5的MacBook Pro上,使用MLX LM,多个开源模型在接收到提示后生成第一个词元所需的时间。

或者,正如苹果所述:

我们评估了原生BF16精度的Qwen 1.7B和8B模型,以及4位量化的Qwen 8B和Qwen 14B模型。此外,我们还对两个专家混合模型进行了基准测试:Qwen 30B和GPT OSS 20B。评估使用mlx_lm.generate进行,并报告首次词元生成时间和生成速度。在所有基准测试中,提示大小为4096。生成速度是在生成128个额外词元时测量的。

结果如下:

这里一个重要的细节是,LLM推理生成第一个词元所采用的方法与生成后续词元的方法不同。简而言之,第一个词元的推理受计算能力限制,而后续词元的生成则受内存带宽限制。

这就是为什么苹果也评估了生成128个额外词元的速度。总体而言,M5相比M4显示出19-27%的性能提升。

苹果对这些结果的评论如下:

在本文测试的架构上,得益于其更高的内存带宽,M5相比M4提供了19-27%的性能提升。关于内存占用,配备24GB内存的MacBook Pro可以轻松容纳一个BF16精度的8B模型或一个4位量化的30B MoE模型,使得这两种架构下的推理工作负载内存占用均低于18GB。

苹果还比较了图像生成的性能差异,并表示M5完成工作的速度比M4快了3.8倍以上。

您可以在此处阅读苹果的完整博客文章,并在此处了解更多关于MLX的信息。

pony的头像

pony

有钱人终成眷属。

相关文章

苹果新闻

重磅!Apple TV《棕榈皇家》两季后遭砍,无缘第三季

2026年3月3日
100
苹果新闻

iPhone 17e全新壁纸免费下载!超清提取版抢先get

2026年3月3日
100
苹果新闻

免费Claude用户狂喜!现在也能用记忆功能,还能直接吸走竞品全部上下文

2026年3月3日
100
苹果新闻

iPhone 17e 完胜 iPhone 16?便宜100美元却性能碾压,值不值得换新?

2026年3月3日
100
苹果新闻

苹果2026年3月最新回收价值大更新!Mac暴跌超70%,iPhone/iPad多数上涨

2026年3月3日
100
苹果新闻

iOS 26 偷偷改了 iPhone 常亮显示!这个变化你可能超级讨厌

2026年3月3日
100
下一篇文章

watchOS 26 新增一项让我爱不释手的 Apple Watch 技巧

《Pluribus》成为Apple TV有史以来最火爆的剧情类剧集首播

请登录 加入讨论

推荐文章

苹果TV《哥斯拉大战金刚》无人机盛宴创世界纪录!史诗级营销炸裂全场

2026年2月24日
100

苹果TV本周炸裂首播!《怪兽宇宙》神剧第二季杀到,第一波口碑炸裂

2026年2月25日
100

DuckDuckGo炸裂更新!免费加密实时AI语音聊天震撼登陆Duck.ai

2026年2月10日
101

智能家居升级日记:13年后重新打造我的梦幻新家,这次要玩真的!

2026年2月14日
100

热门文章

  • 全新 iPhone Air 与 iPhone 17 Pro 壁纸下载 [更新:iPhone 17]

    0 分享
    分享 0 Tweet 0
  • 苹果发布 macOS 26.3 首个开发者测试版,新功能前瞻

    0 分享
    分享 0 Tweet 0
  • iOS 26 全新图标一览:所有应用在 iPhone 主屏幕上的新面貌

    0 分享
    分享 0 Tweet 0
  • 2025年最佳iPhone车载CarPlay应用推荐

    0 分享
    分享 0 Tweet 0
  • 2026年iPad路线图:各款新机型发布时间预测

    0 分享
    分享 0 Tweet 0

近期文章

  • 重磅!Apple TV《棕榈皇家》两季后遭砍,无缘第三季 2026年3月3日
  • iPhone 17e全新壁纸免费下载!超清提取版抢先get 2026年3月3日
  • 免费Claude用户狂喜!现在也能用记忆功能,还能直接吸走竞品全部上下文 2026年3月3日

分类

  • Mac产品库
  • Mac游戏推荐
  • Mac软件推荐
  • 苹果新闻

订阅网站内容

订阅网站内容以便第一时间阅读你感兴趣的内容

订阅即表示同意我们的服务条款和隐私政策。

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录
没有结果
查看所有结果
  • 首页
  • 订阅
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
  • Mac教程
  • macOS下载
  • Mac产品库

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接