欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 教育 > 高考 > 基于 AI Coding 「RTC + STT」 Web Demo

基于 AI Coding 「RTC + STT」 Web Demo

2025/9/14 19:57:21 来源:https://blog.csdn.net/phantom_111/article/details/145346525  浏览:    关键词:基于 AI Coding 「RTC + STT」 Web Demo

文章目录

    • 1. 写在最前面
      • 1.1 旧测试流程
      • 1.2 新测试流程
    • 2. Cursor 编程 vs Copilot 编程
      • 2.1 coding 速度
      • 2.2 coding 正确性
    • 3. 碎碎念

1. 写在最前面

为了 Fix 语音转文字(STT)产品在 Json 协议支持上的问题,笔者需要将推送到 RTC 的数据按照正确的格式进行解析,并且确认收到内容符合 Fix 的产品要求。

注:RTC 实时音视频,即 RTC(Real-Time Communication),是一种实时通信技术,它允许计算机、网络设备或移动设备之间进行音频、视频或数据交换。RTC 的核心是交流,强调对语义信息进行高质量和高效率的传递。借助 RTC,用户可以进行基本的音视频通话,实现线上交流的目的。

语音转文字,可以将指定的 RTC 频道的语音识别成对应的文字,并将对应的文字推送回频道,效果参考下图。

1.1 旧测试流程

  • 开启一个 RTC 频道

  • 针对该频道开启 STT 任务

  • 确认 RTC 频道是否有收到 STT 任务识别的结果

1.2 新测试流程

本着优化旧版本测试流程过程的目标 + 刚好过年前期业务压力没有过分紧张,笔者借助「copilot + cursor」的 AI 编程能力,实现了一个支持基于「RTC + STT」的极简版 Web demo。

效果如下:

在这里插入图片描述

注:不要问为什么用了两个 AI 编程助手,因为 cursor 免费的体验消耗完成了,但是 demo 还没完成

2. Cursor 编程 vs Copilot 编程

2.1 coding 速度

  • 速度

    • Cursor 的问答及 coding 速度,整体上都要比 Copilot 要快,比如笔者问 Cursor 下面的问题,它正确的按照要求完成了功能,并且直接可以运行。尤其是 coding 的速度上, Cursor 使用的是哪里需要修改,就在哪里插入新增代码的方式

      在这里插入图片描述

  • Copilot 的 coding 速度真的让我放弃后面功能继续使用它写,想开个 Cursor 的账户的冲动(想了一下,还是要除夕之后,争取最大价值使用),它的 coding 方式很呆,必须重新覆盖写整个文件,就……,参考下面的问答:

    在这里插入图片描述

    注:公平起见,笔者也让 Copilot 支持类似一个 Web 「button」的功能

2.2 coding 正确性

  • 在简单功能的 coding 上 cursor 几乎一遍都对,但是 copilot 偶尔需要问答两次才能给出正确答案。

  • 在复杂的功能的 coding 上,比如将转录的内容在 Web 界面上进行展示的功能上, cursor 和 copilot 回答的表现打平。

    注:这部分的原因也有可能是笔者问答的不专业,没有正确的给出返回结果的定义,导致 AI coding 的时候,使用了错误结果定义字段,导致转录的结果无法在 Web 上展示

3. 碎碎念

虽然把兴趣作为工作的时候,偶尔会觉得兴趣好像会变得没有那么有趣了,但是保持好奇心真的是所有兴趣最好的老师!

  • 任何一个你不喜欢又离不开的地方,任何一种你不喜欢又摆脱不了的生活,就是监狱。如果你感到痛苦和不自由,希望你心里永远有一团不会熄灭的火焰,不要麻木,不要被同化,拼命成为一个有力量破釜沉舟的人。

  • 18岁很好,28岁也不差,38岁可能会更好,只要皱纹不长进心里,我们永远风华正茂。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词