春天文章网 手机版
中国 美国 亿元 万元 关税 企业 公司 项目 文化 同比增长
您的位置: 首页 > 实时讯息 >

8秒转录30分钟播客:MacWhisper应用接入英伟达Parakeet模型

IT之家 6 月 28 日消息,科技媒体 9to5Mac 昨日(6 月 27 日)发布博文,报道称 macOS 应用 MacWhisper 在近期版本更新中,通过接入英伟达的 Parakeet 模型,转录速度飙升。

IT之家曾于 2023 年 2 月报道,开发者 Jordi Bruin 推出 MacWhisper 应用,主要基于 OpenAI 的 Whisper 转录模型,可以在本地完成音频文件转录为文本的工作。

不过随着 OpenAI 将重点转向更具商业价值的 gpt-4o-transcribe 模型,Whisper 开始显得有些过时,更快、更新的转录模型一次次超越 Whisper。

英伟达于上月宣布 Parakeet 模型,拥有 A100、H100、T4 或 V100 GPU 的硬件上,仅需 1 秒钟就能转录 60 分钟的音频。

Parakeet 可以通过开源工具获得,但问题在于,并非每个人都熟悉命令行界面或自定义模型部署,而用户现在通过新版 MacWhisper,可以更轻松地使用该功能。

应用开发者 Jordi Bruin 表示:“得益于我们与 Argmax 团队的协作,MacWhisper 现在支持 Parakeet 模型。为了展示这一变化的重大意义,请查看下面的 GIF,我们用不到 8 秒的时间转录并整理了一个 30 分钟的播客!

该媒体随后用新版 MacWhisper 应用实测,一个 3 小时的 9to5Mac Happy Hour 播客节目,转录仅用了 1 分 22 秒。

相关文章