麦克豌豆 MacPea.com
没有结果
查看所有结果
  • 登录
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
  • mac软件下载平台
    • Sketch破解版
    • 红警Mac版
    • IDEA 2026 破解版
    • Navicat Mac破解版
    • Final Cut Pro
    • Acrobat Pro Mac破解
    • SketchUp Mac破解
    • AutoCAD Mac破解
    • CorelDRAW Mac破解
    • Lightroom Mac破解
    • EndNote破解
    • Downie破解
    • AnyGo破解
    • iStat Menus破解
    • Tuxera NTFS破解
    • DaVinci Mac破解
    • prism mac破解
    • Rhino破解版
会员计划
现在订阅
  • 首页
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐

    经典射击游戏反恐精英CS 1.6正式登陆Mac平台

    通过这款 Apple Arcade 新游戏,在 Vision Pro 上走进《Jeopardy!》的世界

    苹果Arcade九月阵容:NFL橄榄球、危险边缘与热门游戏更新齐登场

    苹果Arcade新增四款游戏 包括《培乐多彩泥世界》

    苹果新闻+推出全新「表情猜词游戏」 支持iOS 18.4及以上系统

    评测:明基GP520投影仪为Apple TV 4K打造Vision Pro级影院体验,游戏娱乐更出众

    热门标签

    • Mac游戏
    • NBA 2K25 for Mac
    • Easy Red 2 for Mac
  • Mac教程
  • macOS下载
  • Mac产品库
  • mac软件下载平台
    • Sketch破解版
    • 红警Mac版
    • IDEA 2026 破解版
    • Navicat Mac破解版
    • Final Cut Pro
    • Acrobat Pro Mac破解
    • SketchUp Mac破解
    • AutoCAD Mac破解
    • CorelDRAW Mac破解
    • Lightroom Mac破解
    • EndNote破解
    • Downie破解
    • AnyGo破解
    • iStat Menus破解
    • Tuxera NTFS破解
    • DaVinci Mac破解
    • prism mac破解
    • Rhino破解版
没有结果
查看所有结果
麦克豌豆 MacPea.com
没有结果
查看所有结果
Home Mac软件推荐

苹果的新语音转录AI有多准确?我们与Whisper和Parakeet进行了对比测试

pony的头像 由 pony
2025年7月4日
在 Mac软件推荐
阅读时间:2 分钟阅读
A A
0

你可能喜欢

DuckDuckGo炸裂更新!免费加密实时AI语音聊天震撼登陆Duck.ai

Apple @ Work:苹果押注本地AI大获成功,但我们的设备管理工具即将面临巨大变革!

2026年绝不能再忍!用Incogni彻底夺回你的隐私控制权

正如我最近提到的,虽然Whisper是我们印象中最好的语音转录模型之一,但OpenAI已经远离了它。不过,苹果新推出的声音API比Whisper更快的消息是个好消息。但是它的准确度如何呢?我们进行了测试。

全 disclosure:本文的想法来源于开发者Prakash Pax,他本人也做了测试。正如他解释的:

我录了15个英文音频样本,随机从15秒到2分钟不等。并测试了这三种语音转录工具。

  • 苹果的新语音转录API
  • OpenAI Whisper Large v3 Turbo
  • Eleven Lab’s scribe v1

我不会将他的结果贴出来,否则你不会有动力去查看他有趣的博客文章。

不过他补充了关于方法论的注意事项。“我不是非英语国家的人。所以其他人可能会有不同的结果。”他的测试让我对苹果和OpenAI与NVIDIA的Parakeet(目前最快的语音转录模型)进行对比充满了好奇。

我做了什么

由于我不是非英语国家的人,我决定使用最近一集

我们 Daily
,
这集长度为7分31秒。

我用了MacWhisper来运行OpenAI的Whisper Large V3 Turbo和NVIDIA的Parakeet v2。对于苹果的声音API,我使用了Finn Vorhees的优秀Yap项目。我在16GB RAM的M2 Pro MacBook Pro上运行它们。

对于实际的字符错误率(CER)和单词错误率(WER)分析,由于计算字符和单词错误率的方法多种多样(例如:是否归一化间距?是否忽略大小写?是否忽略标点符号?),我转向了这两个 Hugging Face 的项目:Metric: cer 和 Metric: wer。

这两个指标在其各自的页面上概述了它们的计算方法,因此在这里我不打算深入讨论。关键在于所有模型都是使用相同的方法进行评估,这有助于确保基准一致且总体趋势可靠,即使在稍有不同的方法下,数字可能会有所不同。

他们是如何做到的


模型

语音转录时间

字符错误率

单词错误率
Parakeet v2 2秒 5.8% 12.3%
Whisper Large V3 Turbo 40秒 0.2% 1.5%
Apple 9秒 1.9% 10.3%

进一步深入探讨,我决定让 ChatGPT、Claude 和 Gemini 也计算 CER 和 WER。以下是他们的结果,并附有他们报告的方法说明:

ChatGPT (o4-mini-high)

作为基准和每个假设(Apple、Parakeet、Whisper)的第一个步骤,它们都经过了标准化的文本处理:

  • 将所有文本转换为小写
  • 删除所有标点符号(句号、逗号、引号等)
  • 压缩任何连字符 whitespace 到单个空格
  • 这样我们就可以仅比较字词本身,而不考虑格式或大写。

模型

语音转录时间

字符错误率

单词错误率
Parakeet v2 2秒 6.0% 12.3%
Whisper Large V3 Turbo 40秒 0.4% 1.4%
Apple 9秒 2.1% 10.2%

Claude (Sonnet 4)


文本标准化协议:

在计算错误率之前,所有文本都经过标准化处理以确保公平比较:


  1. 案例规范化

    :转换为小写

  2. 标点符号规范

    :

    • 曲线引号(‘ ‘)转换为直引号(‘)
    • 曲线引号(” “)转换为直引号(“)
    • 横连字符(–)转换为连字符 (-)

  3. 空白规范化

    :替换多个空白字符为单个空格

  4. 去除前导和末尾空白

    : 删除开头和结尾的空白字符


注意:

我尝试使用Anthropic的Claude 4 Opus,但由于Anthropic端的服务器容量限制,出现了错误信息。


模型

转录时间

字符错误率

词错误率
Parakeet v2 2秒 8.4% 11.0%
Whisper Large V3 Turbo 40秒 0.1% 1.0%
Apple 9秒 3.5% 8.2%

Gemini (2.5 Pro)

所有文本(包括 baseline和假设文件)都进行了标准化处理,以确保公平比较。标准化过程包括:

  • 将所有文本转换为小写。
  • 删除所有标点符号(例如:,,.,?,‘,“)。
  • 将连字符替换为空格(例如:“end-to-end”变为“end to end”)。

模型

转录时间

字符错误率

词错误率
Parakeet v2 2秒 7.6% 12.3%
Whisper Large V3 Turbo 40秒 0.3% 0.4%
Apple 9秒 3.4% 5.3%

所以,哪个更好?

这里没有大家最喜欢的答案:这取决于。

Whisper显然是最精确的三个模型之一,但如果你在处理一个时间紧迫的项目,并且正在转录一段较长的内容,那么处理时间可能会成为一个问题。

另一方面,如果你更注重速度而不是准确性,Parakeet绝对是你的最佳选择。假设你有一个两个小时讲座的录音,只需要快速找到某个特定段落。在这种情况下,放弃一些精度以换取速度可能是明智的选择。

如果说苹果模型在两者之间找到了一个平衡点,但不是太糟糕的位置。它在速度上接近Parakeet,在准确性方面已经超越了后者。这在尝试它的时候表现得相当不错。

然而,这与Whisper相比仍相去甚远,尤其在需要极小甚至无调整的高质量转录工作中。但就其完全本地运行、无需依赖第三方API或外部安装这一点而言,这是一个重大突破,尤其是在开发者采用率不断上升以及Apple持续迭代的过程中。

Mac软件下载:https://www.macapp.so/app/

pony的头像

pony

有钱人终成眷属。

相关文章

Mac软件推荐

DuckDuckGo炸裂更新!免费加密实时AI语音聊天震撼登陆Duck.ai

2026年2月10日
120
Mac软件推荐

Apple @ Work:苹果押注本地AI大获成功,但我们的设备管理工具即将面临巨大变革!

2026年2月1日
113
Mac软件推荐

2026年绝不能再忍!用Incogni彻底夺回你的隐私控制权

2026年2月1日
111
Mac软件推荐

Meta发布首款搭载屏幕的智能眼镜

2025年9月18日
121
Mac软件推荐

摄影师 Tyler Stalman 评测 iPhone 17、iPhone Air 与 iPhone 17 Pro 相机表现

2025年9月18日
268
Mac软件推荐

蒂姆·库克出席温莎城堡国宴 参与特朗普英国之行

2025年9月18日
112
下一篇文章

Apple发布新壁纸为iPhone、iPad及Mac造势

关于配备iPhone CPU的MacBookrumors及与AI Siri合作的可能性,欧盟新App Store规定

请登录 加入讨论

推荐文章

iOS 27 重磅升级!iPhone 主屏幕新增超大尺寸全新小组件

2026年6月22日
102

macOS 27 Golden Gate Beta 2 正式发布!

2026年6月23日
102

苹果WWDC强势预热“全系统闪耀”,YouTube直播链接惊喜上线!

2026年6月2日
105

Virtual Driving School for Mac 真实路况模拟学习驾驶技能

2026年6月3日
104

热门文章

  • macOS 26.5 正式推送,这次更新都有啥新变化

    0 分享
    分享 0 Tweet 0
  • OpenAI 把 Codex 带进 ChatGPT 手机端:iPhone、iPad 和 Android 都能用了

    0 分享
    分享 0 Tweet 0
  • iPhone 18 Pro 发布日期:苹果新款机型到底什么时候出

    0 分享
    分享 0 Tweet 0
  • 苹果重磅发布 Xcode 26.3:正式引入 Agentic Coding,AI智能体直接写代码!

    0 分享
    分享 0 Tweet 0
  • 2026年iPad路线图:各款新机型发布时间预测

    0 分享
    分享 0 Tweet 0

近期文章

  • 史努比又来啦!《史努比露营乐》第二季重磅登陆Apple TV 2026年6月26日
  • 苹果 Xcode 26.6 重磅更新:正式集成 Google Gemini 编程助手! 2026年6月26日
  • iPhone 用户终于能搜索 WhatsApp 频道更新啦! 2026年6月26日

分类

  • Mac产品库
  • Mac游戏推荐
  • Mac软件推荐
  • 苹果新闻

订阅网站内容

订阅网站内容以便第一时间阅读你感兴趣的内容

订阅即表示同意我们的服务条款和隐私政策。

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接 | Mac软件之家 | Parallels Desktop 破解 | Photoshop Mac 破解 | office mac 破解 | CleanMyMac 破解

欢迎回来!

在下面登录您的帐户

忘记密码?

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录
没有结果
查看所有结果
  • 首页
  • 订阅
  • 苹果新闻
  • Mac软件推荐
  • Mac游戏推荐
  • Mac教程
  • macOS下载
  • Mac产品库

© 2025 麦克豌豆 MacPea.com - 湘ICP备18009176号 | 友情链接 | Mac软件之家 | Parallels Desktop 破解 | Photoshop Mac 破解 | office mac 破解 | CleanMyMac 破解