找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 3|回复: 0

语音转文本的开源模型,各位有接触过吗?

[复制链接]

98

主题

2

回帖

508

积分

高级会员

积分
508
 楼主| 发表于 昨天 23:21 | 显示全部楼层 |阅读模式
想找一个开源的模型,大厂的模型有推荐的吗?
目前有了解 OpenAI Whisper
想满足:
1.能支持 GPU 加速
2.准确率高(降噪啥的)支持中英混合,主要是中国口音的英语(没有歧视的意思, 纯业务需求)
3. 速度尽可能的快
场景是离线的。

=============
就是做这个相关的,比较流行的是 kaldi2 、funasr 、wenet 、sensevoice ,都提供了很多预训练的模型,在 cuda 上都能跑,
其中 sensevoice 的 readme 写了 Multilingual Speech Recognition: Trained with over 400,000 hours of data, supporting more than 50 languages, the recognition performance surpasses that of the Whisper model.
他们的效果超过 Whisper






您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|MJJ出品

GMT+8, 2025-7-17 20:32 , Processed in 0.049255 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表