|
想找一个开源的模型,大厂的模型有推荐的吗?
目前有了解 OpenAI Whisper
想满足:
1.能支持 GPU 加速
2.准确率高(降噪啥的)支持中英混合,主要是中国口音的英语(没有歧视的意思, 纯业务需求)
3. 速度尽可能的快
场景是离线的。
=============
就是做这个相关的,比较流行的是 kaldi2 、funasr 、wenet 、sensevoice ,都提供了很多预训练的模型,在 cuda 上都能跑,
其中 sensevoice 的 readme 写了 Multilingual Speech Recognition: Trained with over 400,000 hours of data, supporting more than 50 languages, the recognition performance surpasses that of the Whisper model.
他们的效果超过 Whisper
|
|