欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 教育 > 幼教 > TTS:F5-TTS 带有 ConvNeXt V2 的扩散变换器

TTS:F5-TTS 带有 ConvNeXt V2 的扩散变换器

2025/9/23 9:53:30 来源:https://blog.csdn.net/qq_42192693/article/details/148030227  浏览:    关键词:TTS:F5-TTS 带有 ConvNeXt V2 的扩散变换器

1,项目简介

F5-TTS 于英文生成领域表现卓越,发音标准程度在本次评测软件中独占鳌头。再者,官方预设的多角色生成模式独具匠心,能够配置多个角色,一次性为多角色、多情绪生成对话式语音,别出心裁。

  • 最低配置:无需显卡,CPU亦可推理生成
  • 据说耗时是所有TTS中最低的
  • 项目地址:https://github.com/SWivid/F5-TTS

2,项目启动

【傻瓜式启动】

conda create -n f5-tts python=3.10
conda activate f5-tts
pip install torch==2.4.0+cu124 torchaudio==2.4.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124
pip install f5-ttsf5-tts_infer-gradio --port 7860 --host 0.0.0.0

【部署式启动】

  • 服务端:socket_server.py
  • 客户端:socket_client.py

3,功能支持

 E2/F5 TTS 只能功能:

  • F5-TTS(通过流式匹配模仿流利、忠实语音的童话故事机)
  • E2 TTS(令人尴尬的简单完全非自回归零样本 TTS)

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词