选择你喜欢的标签
我们会为你匹配适合你的网址导航

跳过将删除所有初始化信息

您的位置：0XUCN > 资讯 > 技术

新闻分类

科技
- 通信
- 数码
- 科学
互联网
- 融资
- 新零售
- 企服
- 共享
- 教育
- 医疗
- 物联网
- 安全
- 智能
- 政策
- 动态
- 技术
- 软件
娱乐
- 电影
- 电视剧
- 综艺
- 动漫
- 音乐
- 明星
- 网娱
- 韩娱
- 热点
- 值得买
游戏
- 手游
- 端游
- 页游
- 主机
- 公告
- 攻略
体育
- 业界
- 足球
- 篮球
- 彩票
汽车
- 车讯
- 新车
- 评测
时尚
- 奢侈品
- 时装
- 美妆
- 美体
健康
- 疾病
- 两性
- 健美
- 医美
- 养生
- 新冠
旅游
母婴
- 孕产
- 哺育
- 早教
- 亲子
- 萌娃
房产
- 资讯
- 家居
- 家电
教育
- 高考
- 考研
- 公考
- 留学
- 高校
- 小初高
宠物
- 资讯
- 百科
- 训练
- 常识
- 宠物用品
其它
造数

FasterWhisperGUI国内开发者整合的语音转字幕神器

技术 PRO 作者：funnyg 2024-02-22 13:45

因为国内禁了HuggingFace，所以我最近在部署fast-whisper-web时遇到了麻烦。转而找到了一个国内开发者CheshireCC整合的开源项目：faster-whisper-GUI。

不得不说：虽然很多技术源头来自国外开发，但国内开发者却能把这些技术整合出花样来。faster-whisper-GUI就把Demucs、fast-whisper、whisperX这三个项目整合到了一起。你不得不说作者很有创意：为了减少人声转字幕背景音的干扰，直接把人声提取工具Demucs也整合进来了。语音转文字则使用的是whisper的衍生项目faster-whisper，提取速度更快对显卡的要求更低。最终字幕输出则用到了whisperX。

在使用faster-whisper-GUI前要切换到模型页面，加载faster-whisper模型。作者直接推荐用large模型进行处理，我用RTX2060S测试了一下，速度还是挺快的，所以中端显卡即使用large模型也不用担心速度。

然后切换回主界面，如果你想对音频做一个人声分离再处理，可以用到Demucs，事实上faster-whisper在这一块做的已经足够好，直接进入faster-whisper进行语音转字幕即可。

在转写时模型可自动识别语言类型，但是还是建议提前在fast-whisper的参数页选择好语种。

然后运行转写就可以看到语音识别出台词了（不知道大家看台词能不能猜出我用的案例是哪部电影）。

处理完后会切换到WhisperX进行字幕输出，通过WhisperX可以对输出的文件类型和编码等进行设置，然后就可以导出字幕或者文本文件了。

faster-whisper-GUI其实是一个整合项目，整合了faster-whisper0.9、whisperX3.1.1、Demucs4.0。

虽然我一般更偏向于用原生项目，毕竟原生项目更新更及时，而整合项目毕竟容易有烂尾风险。但是在HuggingFace被禁的大背景下，一些整合项目不仅实用也是大家最省事的解决方案。

下载地址：https://pan.quark.cn/s/b2423764b018#/list/share

0XU.CN

[超站]友情链接：

四季很好，只要有你，文娱排行榜：https://www.yaopaiming.com/
关注数据与安全，洞悉企业级服务市场：https://www.ijiandao.com/

*文章为作者独立观点，不代表 0XUCN 立场

本文由 funnyg发表，转载此文章须经作者同意，并请附上出处(0XUCN)及本页链接。

原文链接 https://www.0xu.cn/article/intelnet/technology/36834.html

FasterWhisperGUI fast-whisper-web HuggingFace Demucs fast-whisper whisperX Demucs

图库

公众号

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接

fastposter

processon

itrust

SSL

K2CMS

百度热搜榜

排名热点搜索指数

分享文章

微信
微信扫码分享

新浪微博
离开
复制链接
返回顶部