天极大咖秀

登录 | 申请注册

从冬奥看中国科技(三):数字人的觉醒与进化

脑极体 2022-02-15 阅读: 5,122 次

冬奥赛事已过半,我们的情绪也在酣畅淋漓的竞技中跌宕起伏。在谷爱凌自由式滑雪的比赛中,武大靖代表的短道速滑团体赛的金牌中激昂;也为年轻单板滑雪小将苏翊鸣的银牌成绩判罚不停争论,为顶级花滑运动员羽生结弦的冬奥成绩惋惜。

近日大部分的新闻热搜与情绪都贡献给了这场顶级的体育盛宴,如果想要获得一些情绪的喘息,可以尝试回到冬奥背后的科技与技术中,为在这个世界橱窗中展现出的黑科技们自豪一下,平息处在波谷的情绪。

冬奥中出圈的猎豹高速摄像头,零排放的二氧化碳制冰,突破标准封锁的人工造雪核心技术,智能动车等,集齐了最为前沿的科技成果。在这个世界窗口中,秀出丰硕的技术肌肉。在这些技术成果中,最为显眼的可能就是各种虚拟数字人的形象了。如果持续的关注赛事,在各类转播平台中,总会看到虚拟数字人的忙碌身影,或在无声中用手语为万千观众播报赛事进程,或在侃侃而谈分析赛事。冬奥会上,虚拟人的身影无处不在。

无处不在的冬奥数字人

从冬奥赛事的举办进程来看,虚拟人从一开始就全程参与没有落下。从最开始的“相约北京”奥林匹克文化节开幕式上,虚拟歌手洛天依一展歌喉,演唱的《Time to shine》点燃了会场,为冬奥会宣传助威。

虚拟数字人偶像只是冬奥会上虚拟数字人的开场,冬奥会整个场内外,都不乏虚拟人的形象存在。

如果从虚拟数字人的应用角度来分类,可以分为服务型虚拟人和身份型虚拟人。冬奥会的虚拟人也主要为这两大类。这两大类型的数字虚拟人也主要作为冬奥新闻报道的补充存在。

出镜率最高的就是央视新闻AI手语主播,这位长相亲和甜美的手语主播,能够为观众提供专业、准确的手语解说。并且这位手语虚拟主播有着“24小时无休”的称号,据悉在冬奥会结束后,这位虚拟手语主播将全年无休,为听力障碍群体做好新闻报道。

AI手语虚拟主播是典型的服务型虚拟人。而身份型虚拟人则更强调其人设,如虚拟偶像,真人数字分身等。

虚拟歌手洛天依,热搜附体的奥运健儿谷爱凌数字人分身、央视主播王冰冰数字人分身、天气主持人冯殊的数字人冯小殊等。这些虚拟数字人凭借其人设本身,吸引流量,为冬奥赛事报道、解说,给观众带来新奇的体验。

运动员谷爱凌最近的热搜报道太多,估计很多读者被刷屏到厌烦,我们就拿气象频道主持人冯殊举例,看看虚拟数字人分身的炼成过程。

(虚拟天气主播冯小殊)

冯小殊的诞生背后是来自于微软小冰提供的技术。据悉,微软小冰通过深度神经网络渲染技术及小样本学习技术,仅用1周的时间就完成了对冯殊本人的学习。经过语音、嘴型、人脸渲染专家模型训练,虚拟数字人可以完美的get冯殊本人的嘴部动作、眼部及脸部肌肉之间的协同关系,其面容、表情、肢体动作的整体自然度跟真人几乎无异。如果没有特别强调数字人身份的话,几乎以假乱真,完全分辨不出来。

观察虚拟人在冬奥的应用场景,我们会发现,虚拟人从鼻祖初音未来偶像的电脑CG技术,到现在通过AI技术的升级,可以即时翻译的手语主播和以假乱真的虚拟人分身的转变,十多年的时间跨度,虚拟数字人的技术积累已经发生了质的飞跃。技术驱动下,数字虚拟人在冬奥会这个世界橱窗中,集中展示了近几年的成果。

虚拟数字人的崛起

肉眼可见的虚拟数字人近两年发展飞速。清冷古风气质的虚拟偶像LING翎、时尚博主AYAYI、虚拟美妆达人柳夜熙,这些带货强劲的虚拟主播是许多年轻时尚观众熟悉的虚拟数字人。而在科技圈中,清华大学知识工程实验室的虚拟学生华智冰,这类高度拟人的数字人向大众展现了虚拟人最前沿的技术能力。

落地相较普遍的是虚拟导游、主播、数字航天员等,这类虚拟人多数是由科技企业面向传统B端客户推出的数字人方案服务。没有人设的堆砌,这类虚拟数字人作为企业员工的平替,代替企业进行内容的简单生产与交互,为企业产品与技术进行宣传和服务。

我们可以从虚拟人的应用场景中发现,其应用的领域主要为文娱及服务行业。无论是数字偶像日渐成熟的画面呈现方式,还是融合5G、AI 等综合技术能力应用提升,虚拟人落地的场景变得逐渐丰富起来。

最卷打工人万科的虚拟数字人“崔晓盼”,代表了办公场景中虚拟人的技术水平。在系统算法的加持下,崔晓盼可以以远高于人类千百倍的效率在各种应收、逾期提醒及工作异常侦测中大显身手。她催办的预付应收/逾期单据核销率达到91.44%。

(虚拟数字美妆博主柳夜熙)

从最开始吸引眼球的精致虚拟偶像到现今在社交、游戏、办公场景等具体的应用,在直播电商、偶像代言、陪伴服务等,虚拟数字人都实现了商业变现。

而背后的技术服务商,是一众技术与财力雄厚的头部科技企业,如百度、腾讯、科大讯飞、阿里等,也有AI技术创企中科智能、云舶科技等。这些企业在自身AI技术的积累下与元宇宙的未来中,作为先手部队以虚拟数字人切入,抢占虚拟数字世界的蛋糕。

无论是作为何种身份与技术能力的展现,整个市场呈现出一片繁荣的景象,我们会看到各种虚拟人在不断的增加。他们的崛起,与AI能力与数字技术的高速发展不无关系。

深究虚拟人走红的本质,是虚拟数字世界逐渐泛化的展现。现实世界与数字世界之间的界限不断融合与模糊,虚拟数字人是这两个世界连接最合适的载体,作为虚拟数字世界的入口,无论是视觉化、沉浸式的体验,还是综合技术的展现,虚拟人都在这个天时地利的机遇中,成为两个世界沟通与融合的桥梁。不过在这个看似百花齐放的市场中,由技术驱动虚拟数字人的发展仍在发展的初始阶段。

跨越的鸿沟与进化

冬奥会中展现出的数字人的技术能力,几乎代表了现阶段数字虚拟人的最高水平。在5G、AI、数字技术等加持下,现阶段的虚拟人通过自我学习和算法能力可以实现与人语音、手势的交互。在这类资金实力充足的体育盛事中,集中力量打造与展现符合赛事报道的数字人相较容易。但在广泛的落地过程中,虚拟数字人的发展仍存在不少的障碍。

从虚拟人的应用角度来看,身份类数字人如偶像洛天依、谷爱凌等数字分身人等,这类数字虚拟人需要IP人设的专人运营。尤其是带有偶像性质的虚拟人,需要过硬的专业作品与内容创作来延续人设生命力与商业价值。这也提高了其应用的门槛与成本。据悉,虚拟偶像的一支单曲从编曲到人物形象、舞台设计等就需花费近200万元,再加上宣发推广的费用,培养成本甚至会超过真人偶像。

而服务类的虚拟数字人,技术的能力参差不齐。我们对虚拟人的终极想象是与人交互的自然流畅,类似真人交互般的体验丝滑,但这对虚拟人的综合技术能力要求较高。需要在技术层面诸如NLP、机器视觉、TTS语音合成等多种基础AI的分析与处理能力都达到顶级水平。对技术的要求与成本都过高,复杂的技术与冗长的定制周期,使其无法快速大范围推广。

虚拟数字人在发展的过程中,还有无法避免的伦理问题。人脸识别技术、AI换脸等技术在落地推广的过程中,都曾发生过这类舆论风险。类人虚拟人,也会存在对人物原型的假冒替代等风险,万众瞩目的代价就是被无数放大镜放大缺陷,带来滑向深渊的可能。

道的规律揭示事物在发展的过程中,总会历经高峰与低谷。一蹴而就达成的结局也如昙花乍现一般短暂,坚持长远正确的选择,是去往星辰大海的必选项。数字世界无人区的持续深耕,荆棘无可避免。

从探索期到成长期,数字虚拟人仍处在初始爬坡期,智能化水平目前比较初级,无法应对复杂的工作环境。距离泛化的应用还有一段“长坡”需要克服。但在目前这些窗口的展示中,我们也窥见了虚拟数字人的未来:强大的分析与数据处理能力,多元的身份与丝滑的服务,虚拟数字的世界逐渐丰富与立体。

从平面的图文影音,到实时丝滑的3d交互,讯息的传播不断升维。未来我们也会拥有类似《头号玩家》中的元宇宙“绿洲”虚拟世界:智慧情感等级类人的数字人,复刻数字面具下的真人,自然流畅的交互体验,真假难以分辨的虚虚实实。

无论是在现实世界还是虚拟世界,虚拟人都会作为类人生命体的最佳补充,丰富数字世界,拥有无限的生命力与想象空间。

脑极体
从技术协同到产业革命,从智能密钥到已知尽头

特别声明:文章版权归原作者所有,文章内容为作者个人观点,不代表大咖秀专栏的立场,转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)