【无标题】

WebRTC 视频通话技术分享

前言

最近在做 KVM 项目，该项目需要使用 webRtc 技术实现视频流的推送和播放，因此在做项目之前我计划通过搭建 demo 的方式好好再复习一下 webRtc 通信技术，顺便给大家做个分享。

下面是最终的demo的实现效果：

WebRTC 简介

WebRTC 是一个开放平台，它允许浏览器之间进行视频、音频、屏幕共享等视频通信，是一种端对端的技术，因此他传输媒体流的时候是不会经过服务器的，服务器的作用只是用于端之间建立连接，一旦连接建立成功，则直接通过 WebRTC 协议进行通信，不需要再经过服务器（这个时候如果没有特殊处理，我们甚至可以停掉服务器，视频流的推送仍然可以继续进行）。它基于 HTML5、JavaScript、WebSockets、WebRTC 等技术实现。

本次分享包含的技术信息

WebRTC 搭建视频流推送和播放
浏览器获取媒体流
基于 nodejs 的 http 和 websocket 通信服务器搭建。
前端工程化构建

工程架构概览

因为这个 demo 是前后端的内容都有，因此我将前后端的内容分为两个工程，最后将两个工程进行整合。目录结构如下：

– client
– server
– node_moudules
– package.json

工程搭建

整体工程

创建目录并且初始化仓库

mkdir webrtc-demo
cd webrtc-demo
npm init -y

配置启动脚本

 "scripts": {"dev:web": "cd ./client && pnpm dev","dev:server": "cd ./server && pnpm dev","dev": "concurrently \"pnpm dev:web\" \"pnpm dev:server\""},

注：concurrently 是一个用于同时运行多个命令的包，这里我们使用它来同时启动两个工程。

前端工程搭建

前端就是使用我们现在熟悉的技术栈 vite + vue3 + antd 搭建，这个完全不需要再赘述。

服务端工程搭建

服务端技术选型是选择我所熟悉的 express 搭建，我们可以使用 express-generater 生成器来直接生成一个 express 项目。但是我这边选择自己手动搭建：

初始化项目

mkdir server
cd server
npm init -y
tsc --init （初始化ts配置）

安装依赖包：

pnpm add express
pnpm add ws
pnpm add nodemon -D （用于热更新）

编写入口文件（通常来说我们应该做很多模块化处理，这里demo为了简单，就将很多逻辑写在一起了。）

import express from 'express'
import { addUser, BaseResponse, getUsers, login, MessageContent, messageHandler } from '.'
import logger from 'morgan'
import { WebSocketServer } from 'ws'
import configWsServer from './wsServer'
import { parseCookies } from './util'const HTTP_PORT = 4004
const app = express()app.use(logger('dev'))
app.use(express.json())app.get('/', (req, res) => {res.send('Hello World!')
})app.get('/api/user', async (req, res) => {const users = await getUsers()res.send(new BaseResponse(true, users))
})app.post('/api/user', async (req, res) => {try {const data = req.bodyawait addUser(data)res.send(new BaseResponse(true))} catch (error) {res.status(500).send(new BaseResponse(false, error))}
})app.post('/api/login', async (req, res) => {try {const data = req.bodyconst user = await login(data)res.cookie('user', user.username).send(new BaseResponse(true, user))} catch (error) {res.status(500).send(new BaseResponse(false, error))}
})app.get('/api/logout', async (req, res) => {res.clearCookie('user').send(new BaseResponse(true))
})app.get('/api/msgs', async (req, res) => {try {await messageHandler.getAllMessages()res.send(new BaseResponse(true, messageHandler.getUserRelatedMessages(parseCookies(req.headers.cookie).user)))} catch (error) {res.status(500).send(new BaseResponse(false, error))}
})const server = app.listen(HTTP_PORT, undefined, () => console.log('listening on: http://localhost:' + HTTP_PORT))
const wsServer = new WebSocketServer({ server })configWsServer(wsServer)

这里主要是初始花了一些 http服务和接口 和 websocket 服务, demo为了尽量简单，使用 cookie 做的登录验证。

用户有关操作

该demo由于没有使用数据库，就在根目录创建了 db 目录，里面存放着 msgs.json 和 users.json 文件，用于存储用户信息以及聊天记录。我们就使用文件读写来代替服务端的数据库读写的功能（有兴趣也可以安装 mySql、postgreSql 等数据库，使用数据库来做持久化操作）。

// 常量：用户信息文件地址和消息文件地址
const userListPath = resolve(__dirname, "../db/users.json")
const msgListPath = resolve(__dirname, "../db/msgs.json")

这里以登录举例，登录就需要我们去数据库查询用户是否存在且密码是否正确，因此我们使用 fs 模块来读取文件，然后使用 JSON.parse 将文件内容转换为对象，然后使用 Array.find 查询用户是否存在，如果存在就返回用户信息，否则就返回 null。

// 登录接口
app.post('/api/login', async (req, res) => {try {const data = req.bodyconst user = await login(data)res.cookie('user', user.username).send(new BaseResponse(true, user))} catch (error) {res.status(500).send(new BaseResponse(false, error))}
})
// 登录方法
export const login = async (user: UserInfo) => {const users = await getUsers()const foundUser = users.find(u => u.username === user.username && u.password === user.password)if (!foundUser)throw "username or password is not correct"return foundUser
}
// 从文件读取所有用户
export const getUsers = async () => {const data = await fs.readFile(userListPath, "utf-8")const user = (JSON.parse(data) || []) as UserInfo[]try {const allOnlineUser = getAllOnlineUsers()user.forEach(item => {if (allOnlineUser.includes(item.username)) {item.online = true} else {item.online = false}})return user} catch (error) {return user}
}

总而言之就是使用文件读取代替数据库操作。

websocket相关

使用 ws 这个库老构建 webSocket 基础服务：

const server = app.listen(HTTP_PORT, undefined, () => console.log('listening on: http://localhost:' + HTTP_PORT))
const wsServer = new WebSocketServer({ server })configWsServer(wsServer)

下面是 configServer 相关的逻辑：

import { Server, type WebSocket } from "ws";
import { parseCookies } from "./util";
import { messageHandler } from ".";
// 消息类型
export enum WsMsgTypes {CALL = 'call',RECEIVE_CALL = 'receive_call',ANSWER = 'answer',CONNECT_SUCCESS = 'connect_success',USER_ONLINE = 'user_online',USER_OFFLINE = 'user_offline',CHAT_MSG = 'chat_msg',ICE = 'ice',SDP = 'sdp',
}// 这里为了统一规范ws消息的格式，使用该类型来约束
export class WsMsgs<T = any> {constructor(public type: WsMsgTypes, public data?: T) {this.type = typethis.data = data}public get content() {return JSON.stringify({ type: this.type, data: this.data })}
}export class CallMsgs {constructor(public from: string, public to: string) {this.from = fromthis.to = to}
}
// 处理消息
export const handleMessage = async (msg: WsMsgs, user: string) => {switch (msg.type) {case WsMsgTypes.CALL:// 发送通话请求sendMsgToUser(msg.data.to, new WsMsgs(WsMsgTypes.CALL, msg.data).content)break;case WsMsgTypes.ANSWER:// 接收通话请求sendMsgToUser(msg.data.to, new WsMsgs(WsMsgTypes.ANSWER, msg.data).content)break;case WsMsgTypes.CHAT_MSG:// 收到连接成功消息await messageHandler.addMessage(msg.data)sendMsgToUser(msg.data.to, new WsMsgs(WsMsgTypes.CHAT_MSG, msg.data).content)sendMsgToUser(msg.data.from, new WsMsgs(WsMsgTypes.CHAT_MSG, msg.data).content)break;case WsMsgTypes.SDP:sendMsgToUser(msg.data.to, new WsMsgs(WsMsgTypes.SDP, msg.data).content)breakcase WsMsgTypes.ICE:sendMsgToUser(msg.data.to, new WsMsgs(WsMsgTypes.ICE, msg.data).content)breakdefault:break;}
}
// 这里存储所有的通信实例，用于存储所有连接的ws实例和用户名
let allConnections: { user: string; ws: WebSocket }[] = []export const getAllOnlineUsers = () => allConnections.map(item => item.user)async function handleConnect(ws: WebSocket, user: string) {if (user) {allConnections.push({ user, ws })console.log(user, 'is online!!');ws.send(new WsMsgs(WsMsgTypes.CONNECT_SUCCESS).content)// 用户上线就发消息给其他用户，通知其他用户有新用户上线sendToAllUser(new WsMsgs(WsMsgTypes.USER_ONLINE, user))}else {// 如果用户不存在，就关闭连接ws.send(500)}
}
// 发送消息给所有用户
async function sendToAllUser(msg: WsMsgs) {try {allConnections.forEach(item => {item.ws.send(msg.content)})} catch (error) {console.log(error);}
}
// 发送消息给指定用户
async function sendMsgToUser(user: string, msg: string) {const conn = allConnections.find(item => item.user === user)if (conn) {conn.ws.send(msg)}
}export default function configWsServer(wsServer: Server) {wsServer.on('connection', (ws, req) => {const user = parseCookies(req.headers.cookie).userhandleConnect(ws, user)ws.on('message', (data) => {handleMessage(JSON.parse(data.toString()), user)})ws.on('close', () => {allConnections = allConnections.filter(item => item.user !== user)sendToAllUser(new WsMsgs(WsMsgTypes.USER_OFFLINE, user))})})wsServer.on('close', () => {console.log('close')})
}

webSocket通信

到此为止后端的大致架子就搭建完成了，前端就需要通过 http 和 websocket 协议使用后端服务，首先前端的登录这里就不说了，简单说一下webSocket通信：

export class WebSocketService {public ws: WebSocketprivate onSdpReceived: (sdp: RTCSessionDescription) => voidprivate onAnswerReceived: (answer: RTCSessionDescriptionInit) => voidprivate onIceReceived: (ice: RTCIceCandidate) => voidconstructor(private callback: (ws?: WebSocket) => void) {this.init()callback(this.ws)}private init() {this.ws = new WebSocket(`ws://${location.hostname}:4004`);this.ws.onmessage = (event) => {this.handleMessage(JSON.parse(event.data))}this.ws.onerror = (error) => {console.log('error', error)}this.ws.onclose = (ev) => {console.log('close', ev)}}private handleMessage({ data, type }: WsMsgs) {const { setUserOnlineStatus } = useUserAction()switch (type) {case WsMsgTypes.CONNECT_SUCCESS:this.callback(this.ws)returncase WsMsgTypes.USER_ONLINE:setUserOnlineStatus(data as string, true)returncase WsMsgTypes.USER_OFFLINE:setUserOnlineStatus(data as string, false)returncase WsMsgTypes.CHAT_MSG:useMsgStore().addChatMsg(data as MessageContent)return// case WsMsgTypes.CALL://     alert("收到呼叫消息")//     // this.onCallReceived?.(data)//     returncase WsMsgTypes.SDP:console.log("收到sdp消息")this.onSdpReceived?.(data.content as RTCSessionDescription)returncase WsMsgTypes.ANSWER:console.log("收到answer消息", data)this.onAnswerReceived?.(data.content as RTCSessionDescriptionInit)returncase WsMsgTypes.ICE:console.log("收到ice消息", data)this.onIceReceived?.(data.content as RTCIceCandidate)}}public on(type: 'sdp_received' | 'answer_received' | 'ice_candidate', callback: (...data: any) => void) {switch (type) {case 'sdp_received':this.onSdpReceived = callbackbreakcase 'answer_received':this.onAnswerReceived = callbackbreakcase 'ice_candidate':this.onIceReceived = callbackbreak}}}

这是我封装的 websocketService，用于前后端之间的双向通信，这里主要实现了 on 方法，用于监听 sdp_received、answer_received、ice_candidate 三个事件，分别对应 sdp、answer、ice 三个消息，这里就不一一实现了，这里只是简单的打印一下，实际开发中可以根据自己的需求进行扩展。其他的消息我这边直接存在了全局状态store里面，store里面来处理各种不同类型的消息，这来也不再赘述这些处理逻辑了，毕竟此次的分享主要是分享webrtc相关的技术内容，前面的铺垫已经非常多了。

webrtc视频通话

webrtc视频通话的实现主要分为以下几步：

获取视频流（屏幕或者摄像头之类的）
创建 PeerConnection 连接
给对方发送推流请求
推流

这个步骤是大致的一个步骤，接下来我们需要详细讨论：

创建 PeerConnection 连接

PeerConnection 是 webrtc 的核心，它封装了 WebSocket 和 RTCDataChannel 等协议，我们可以通过 PeerConnection 来实现视频通话，步骤如下：
1.首先我们就是需要实例化一个 PeerConnection：

export const createPeerConnection = () => {const pc = new RTCPeerConnection(iceConfiguration)return pc
}

获取视频流：我们以摄像头举例，浏览器给我们提供了一个 api 用于获取用户的摄像头视频流： navigator.mediaDevices.getUserMedia，这个 api 接收一个参数，是一个对象，里面可以设置 video 和 audio 的参数，比如 width、height、facingMode 等等，具体可以参考文档。这是一个异步函数，我们需要等待异步结束，拿到这个视频流，然后在本地播放（毕竟视频通话是双向的视频流推送和播放）：

export const getMediaStream = async (constraint: MediaStreamConstraints = {video: true,audio: true
}) => {const stream = await navigator.mediaDevices.getUserMedia(constraint)return stream
}// 本地播放
currentVideoRef.value.srcObject = localStream;

将视频流推送到对端：

 localStream.getTracks().forEach(track => {pc.addTrack(track, localStream)
})

事件监听：我们至少需要监听 pc.onTrack和pc.onicecandidate 事件：
1. pc.onTrack：当对端发送视频流时，会触发这个事件，我们可以通过这个事件来获取对端视频流，并将其播放到本地：
2. pc.onicecandidate：有新的ice候选的时候，会触发这个事件，我们可以通过这个事件来获取对端 ice 消息，并将其发送给对端：
创建请求（offer）并将其设置为pc.localDescription：

 const offer = await pc.createOffer()await pc.setLocalDescription(offer)

将 offer 发送给对端：

    new WsMsgs(WsMsgTypes.SDP, new CallMsgs(targetUser, pc.localDescription)).send()

至此：发送端的操作就完成了，下面是接收端应该做的事情：

接收端通过 websocket 接收到 offer 之后，如果统一这一通视频通话那么就进行如下操作：

首先和发送端一样，都需要获取本地摄像头视频流，并且在本地视频流对应的 video 元素进行播放。
接着创建 PeerConnection，并且将视频流推到该 PeerConnection 中：

    const localStream = await getMediaStream()// 将本地媒体流添加到pc中localStream.getTracks().forEach(track => {pc.addTrack(track, localStream)})return localStream

同样的：我们至少需要监听 pc.onTrack和pc.onicecandidate 事件。
接收端需要将 offer 设置为 pc.remoteDescription：

    await pc.setRemoteDescription(new RTCSessionDescription(sdp))

接收端需要创建 answer 并且将其设置为 pc.localDescription：

    const answer = await pc.createAnswer()await pc.setLocalDescription(answer)

将 answer 发送给发送端：

    new WsMsgs(WsMsgTypes.ANSWER, new CallMsgs(targetUser, answer)).send()

至此：使用webRtc进行端对端的视频通话就完成了。

本次分享的demo的github地址

https://github.com/rondout/webrtc-demo