欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 会展 > OpenWebUI 接上语音对话功能

OpenWebUI 接上语音对话功能

2025/5/20 10:54:19 来源:https://blog.csdn.net/toooooop8/article/details/146565430  浏览:    关键词:OpenWebUI 接上语音对话功能

OpenAI Edge TTS 是一个模仿 OpenAI API 接口的文本转语音服务。在可以自定义接口 URL 的场景中(比如 Open WebUI),它可以直接替代 OpenAI 的语音服务。

该项目使用 edge-tts 包,通过调用 Edge 浏览器的免费"朗读"功能来模拟 Microsoft/Azure 的请求,从而免费提供高质量的文本转语音服务。

系统要求​

  • 已安装 Docker 环境
  • 正在运行的 Open WebUI

⚡️ 快速开始​

最简单的启动方式是直接运行以下命令,无需任何额外配置:

docker run -d -p 5050:5050 travisvn/openai-edge-tts:latest

这将在 5050 端口启动服务,使用默认配置

配置 Open WebUI 使用 openai-edge-tts

  • 打开管理面板,依次进入 设置(Settings) -> 音频(Audio)
  • 按照下方截图配置您的 TTS 设置
  • 提示:您可以在此处选择 TTS 语音

默认的 API 密钥是 your_api_key_here。如果您不需要额外的安全保护,可以保持此默认值不变。

配置完成!您现在可以开始使用了

🐳 Docker 快速配置​

1. 您可以在运行项目的命令中配置环境变量

docker run -d -p 5050:5050 \-e DEFAULT_LANGUAGE=zh-CN \          # 设置默认语言为简体中文-e DEFAULT_VOICE=zh-CN-YunjianNeural \  # 指定中文音色(示例)-e DEFAULT_SPEED=1.2 \              # 可选:调整语速(1.0为正常,0.5~4.0区间)travisvn/openai-edge-tts:latest
docker run -d -p 5050:5050  -e DEFAULT_LANGUAGE=zh-CN  -e DEFAULT_VOICE=zh-CN-YunjianNeural -e DEFAULT_SPEED=1.2   travisvn/openai-edge-tts:latest

Markdown 文本现在会通过过滤器进行处理,以提高可读性和支持。

您可以通过设置环境变量 REMOVE_FILTER=True 来禁用此功能。

说明

  • DEFAULT_LANGUAGE=zh-CN 表示使用简体中文,若需其他中文方言(如台湾地区),可设为 zh-TW 
  • DEFAULT_VOICE 需从支持的中文音色中选择(具体音色列表见下文)。

2. 中文音色选择

Edge-TTS 提供丰富的中文语音选项,覆盖多种方言和风格。以下是常见中文音色示例:

推荐音色列表
语音名称性别方言/风格适用场景
zh-CN-YunjianNeural标准普通话,沉稳自然新闻播报、有声书
zh-CN-YunyangNeural温和亲切,适合对话客服助手、教育内容
zh-CN-XiaoyiNeural年轻活力,发音清晰儿童教育、广告配音
zh-CN-shaanxi-XiaoniNeural陕西口音,地域特色方言内容、特色节目
zh-TW-HsiaoYuNeural台湾腔,柔和自然繁体中文、台湾市场

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词