端到端语音对话(Qwen2.5-Omni)真打不过级联ASR+LLM+TTS?RTX 4090 单卡实测全记录
关键词:Qwen2.5-Omni、端到端语音对话、speech-to-speech、SenseVoice、CosyVoice2、级联语音、RTX 4090、本地部署、显存 OOM、RTF 一句话结论:在 非流式 口径下,Qwen2.5-Omni-7B 端到端 speech-in→speech-out 完整回复要 11.8 秒,而 SenseVoice LLM CosyVoice2 级联只要 5…
2026/6/30 12:50:24
阅读更多