“数字人”(Digital Human)是指通过计算机图形、人工智能、语音合成、动作捕捉等多种技术,构建和驱动的具有拟人形态、行为和交互能力的虚拟人物。它既可以是真实人物的数字复制,也可以是完全虚构的人格形象,广泛应用于数字营销、虚拟主播、智能客服、元宇宙、教育等多个领域。
一、数字人的分类
1. 按形态可分为:
-
2D数字人:常见于动画、平面直播、二次元主播(如虚拟偶像“洛天依”)
-
3D数字人:构建更为逼真,可在元宇宙、虚拟场景中交互(如虚拟演员、3D导游)
-
超写实数字人(Hyper-Realistic Digital Human):外形和动作几乎与真人无差别(如李佳琦数字人)
2. 按驱动方式可分为:
-
真人驱动:通过动作捕捉(Mocap)与语音识别由真人操控
-
AI驱动:通过语音合成、表情驱动、自然语言处理自动生成内容与交互
-
混合驱动:部分由AI驱动,关键动作/内容由真人操控修正
二、关键技术组成
技术领域 | 作用 |
---|---|
计算机图形学(CG) | 建模数字人形象,包括骨骼、皮肤、材质等 |
动作捕捉(Mocap) | 采集人类动作、表情,驱动数字人表现 |
语音合成(TTS) | 实现逼真的语音输出 |
自然语言处理(NLP) | 赋予数字人理解与生成语言的能力 |
多模态感知与生成 | 融合语音、文本、图像等信息,实现自然交互 |
实时渲染与驱动 | 支持数字人实时互动、直播等需求 |
三、典型应用场景
场景 | 说明 |
---|---|
虚拟主播 / 虚拟偶像 | 在直播、电商、综艺中以“数字人”身份出现 |
企业数字员工 | 用于接待、咨询、导览等企业服务 |
教育与培训 | 数字教师、培训讲师,适用于标准化教学 |
元宇宙导览与交互 | 用户的虚拟身份或系统的交互入口 |
文旅/政务导览 | 数字导游、数字文物讲解员 |
影视与广告制作 | 降低制作成本、实现数字替身与虚拟品牌代言 |
四、优势与挑战
优势 | 挑战 |
---|---|
可持续使用,形象可控 | 真实性和情感表达有限 |
可24小时服务 | 技术成本高,训练周期长 |
个性可定制,适应不同场景 | 存在伦理、隐私、版权问题 |
不受物理空间和时间限制 | 需要强大的AI和图形渲染能力 |
五、现实案例
-
百度·数字人度晓晓:知识问答与新闻播报
-
小冰框架(小冰数字人):可大规模自动生成虚拟人
-
央视虚拟主持人:如央视AI主播“新小微”
-
李佳琦数字人(美ONE):直播带货场景中用于分身、互动
-
虚拟艺人AYAYI、翎Ling:社交媒体与品牌代言