热门文章

热门标签

AI手语主播通过朱广权魔鬼面试，残影级手速无惧贯口，今已正式上岗助力冰雪盛会

信息来源：鱼羊发布日期：2022-02-04 主题标签：虚拟人手语主播 AI

什么样的手语主播能跟朱广权battle得有来有回？

话不多说，咱直接板凳瓜子备齐，一起前排围观（手动狗头）：

只见朱广权语速起飞，妙语连珠，频出“魔鬼”面试题，但这位手语老师完全没在怕的：

如此表现，不仅面试官朱广权连连夸赞“精彩”，网友们也纷纷点赞。

没错，这位手语主播并非真人，而是一名来自百度智能云的虚拟数字人。

现在，她已正式上岗冰雪盛会，将在各类冰雪赛事中，为2780万听障人士提供24小时不间断的手语服务。

虽然是初次上岗，但这位AI手语数字人的专业度不容小觑。

根据测评，其手语可懂度能达到85%以上，与主流的中英、中日机器翻译结果相差无几。

毕竟，“台上一分钟，台下十年功”，为了给听障人士们奉上这精彩的瞬间，AI手语数字人背后的程序员们，已经下了不少苦工。

手语数字人背后的技术挑战

在聊技术之前，或许你会好奇这样一个问题，明明有字幕，为啥体育赛事等电视节目还需要手语解说？

实际上，由于种种现实因素的制约，比起文字，手语对听障人士而言更加亲切，也能更快速地传递信息。

因此，屏幕一角的手语翻译，对于特殊人群而言其实是一个“更加平等享受资讯”的窗口。

这也就给AI手语数字人提出了一个本质的技术问题：如何让听障人士能真正看懂数字人打出的手语？

乍一看，这就是个从语音到文本，从文本到手语符号，再到手语数字人动作的一个翻译流程，但深究其背后的技术细节，就会发现需要克服的难点要比表面看上去复杂得多。

首先，语音转手语，并不是简单地构建一个语音到视觉的转换模型就行。

单就语序而言，手语和自然语言之间就存在较大的差异。举个例子，“我想回家”这样一句话，用手语打出来的顺序其实是“家回我想”。

并且，手语还有语言精简的特性，手语的描述会对口语进行精简。

也就是说，如果只是生硬地把口语中的词汇转换成手势，再把动作简单地连接起来，这样打出的手语只能说是“半吊子手语”，听障人士很难看懂。

其次，表情神态同样是手语表达中极为重要的部分。

有时一个手势代表好几个意思，如果没有表情和口型的配合，就可能产生误解。

除此之外，还要考虑数据匮乏、数字人动作灵活度欠缺等种种问题。

总而言之，想要打造一个高质量手语数字人，既需要语音、视觉、自然语言处理等AI技术同时发力，也少不了对于听障人士真实需求的深入调研。

所以，这一次百度智能云的程序员们是如何成功让AI手语主播具备助力冰雪盛会的实力的？

2个月，“做难而正确的事”

研发团队接到手语数字人任务时，距离万众期待的冰雪盛会已仅剩不到2个月的时间。

但就是在这种几乎没有时间试错的情况下，程序员们却放弃了现成的手势汉语语料。

正如前文所言，汉语到手势的简单转换在很多情况下会让听障观众产生理解歧义，实际效果其实是大打折扣的。

为了“治本”，尽管面临数据需要从头采集标注、额外增加的成本难以预估的压力，百度智能云团队还是果断选择了自然手语语料：

做就做难而正确的事。

为此，百度智能云团队联合天津理工大学，组织了上百位听障学生做语料的数据标注，同时邀请手语委专家、特殊教育专家等专业人士，将大量行业知识融合到模型效果和听障人群的体验当中。

打下了高质量的基础，接下来，就是一步步解决手语数字人“听得清”、“会翻译”、“会表达”三个问题。

“听得清”，要靠语音识别模型。

ASR语音识别方面，在NLP、语音领域有着逾10年积累的百度本身已具备成熟的解决方案，识别准确率能达到98%以上，还能hold住中英文混杂、生僻字、方言等特殊场景。

“会翻译”，用上的就是手语翻译模型。

与一般的语言翻译模型不同，由于前文提到的手语表达中语言精简等特性，手语翻译模型需要着重考虑精准度和精简度。

其中精准度影响到数字人手势的精准，而精简度会影响传递信息的及时性。

在高质量数据资源和百度多年积累的神经网络翻译技术的基础上，研发团队设计了从中文文本到手语符号的翻译方法。

通过大规模知识学习、中间件控制等手段，研发团队成功在保障翻译准确率的情况下缩减了译文长度，实现了翻译效果和时延的平衡。

2个月的时间里，经过6次大的版本迭代，这一手语翻译模型可懂度最终达到了85%以上，媲美主流的中英、中日等方向的机器翻译结果，达到了业界领先水平。

最后，数字人的表达靠的是动作生成模型，包括手势、口型、表情的生成。

针对手势问题，研发团队运用人体动作视觉识别技术，让AI学习手语视频，将其中的二维骨骼点转化为驱动三维数字人的手语动作，并且能够精确到每一根手指。

基于此，百度智能云已经建立起拥有近1万个手语动作的强大动作库。

而在口型和表情方面，研发团队运用首创的4D扫描数据进行训练，对表情和口型进行精准校正，通过超10万个全身多边形面、超1万个脸部面、超240个面部表情行变基、超100个身体骨骼界限，赋予了手语数字人自然生动的表情。

wink、吹泡泡都不在话下：

总体上，口型生成的准确度能够超过98.5%。

“降低成本是虚拟数字人发展的关键”

说到这里，想必你也看出来了，百度智能云的程序员们能够大胆挑战更有难度的技术路线，与百度本身长期积累的AI技术、数字人技术不无关系。

实际上，在数字人的生产上，百度已经把上述人像驱动技术、智能对话技术、语音交互技术，以及智能推荐技术汇总到了其平台级产品——百度智能云曦灵平台上。

百度智能云曦灵集数字人生产、内容创作、业务配置服务为一体，无论是虚拟员工这样的服务型数字人，还是虚拟主持人、虚拟偶像这样的演艺型数字人，都能基于该平台一站式打造，甚至是“一句话生成”。

此前与马斯克妈妈梅耶·马斯克对话的百度集团数字人“希加加”：

能够弹琴献唱的“龚俊数字人”：

就都是基于百度智能云曦灵打造。

目前，百度智能云曦灵平台已经推出了3D写实、2D写实、3D卡通三条生产线，实现了银行/保险、运营商、媒体/广电、互娱/品牌商、MCN/艺人经纪等全场景覆盖，一站式打造“能听、能说、能理解、可互动”的数字人。

这就大大加速了一个数字人从设计到落地的流程，有效降低了数字人生产的成本，为数字人的规模化应用打下了基础。

百度集团副总裁吴甜在参加央视《对话》节目录制时还谈到这样的观点：

降低成本是虚拟数字人发展的关键之一。
百度希望通过领先的全栈AI能力，把虚拟人的生产周期缩短到小时级别，降低生产成本，并驱动生成内容。

科技让世界更公平

严格说起来，数字人并不算是全新的事物。

在过去几年中，随着AI等技术的成熟，以及短视频、直播等新兴媒介需求的涌现，数字人正不断涌现出新的面貌和新的应用模式。

而从被提出到今天的广泛落地，“数字人”这一科技热词，其实也已经历了好几个认知阶段。

第一阶段，大家探讨的重点是数字人“真不真”，这是新技术之初见。

当技术落地的尝试开始展开，第二阶段围绕“危机感”的讨论便随之而来：人们开始关注数字人是否会侵占掉人类的工作机会。

现在，或许我们对数字人的认知，又到了进入新阶段的时候。

正如AI手语数字人让冰雪赛事的魅力触达到了更多人群，越来越多的落地案例正在说明，数字人作为一种提升服务效率的方式，并非在“替代”人类工作，而是在填补人力所不能及的空白。

这也正是科技背后真正的价值——并非取而代之，而是帮助人、做人所不能之事。

而当百度这样的科技企业，致力于降低技术的成本、加速技术的落地，体现出的亦正是科技工作者的社会责任担当。

从这个角度来讲，前沿技术俨然不再冰冷和遥远，而是真正在让人类共同体变得更加公平和美好。

你觉得呢？

特别声明：1、以上内容仅代表原作者观点，不代表吾爱元宇宙观点或立场；2、以上内容（包括下载资源）仅供用户学习使用，如需商用请联系原作者；3、如需转载以上内容请保留原始出处并提供链接通道；4、如以上内容侵犯了原作者的版权、著作权、肖像权等，请联系我们，我们会立即审核并处理。

元宇宙神评

相关主题

《黑镜》里“自制”AI男友成真，GPT让普通人轻松构建元宇宙

发布日期：2023-03-20 信息栏目：科技主题标签：AI,人工智能,OpenAI,ChatGPT,GPT-4,Oncyber,元宇宙平台

内容概要：Oncyber将人工智能作为调整、自定义元宇宙内容的工具，可以通过文字就直接创造、修改元宇宙中的环境，而Oasis Origin作为增速最快的元宇宙产品之一，已经开始着手规划一个一半由人类、一半由AI组成的宇宙，在那里，AI记录、模仿人类用户以更加接近人类，并成为人类的替身或者伙伴。
5G+AI+XR，高通藏在元宇宙里的三驾马车

发布日期：2022-09-11 信息栏目：科技主题标签：WAIC,人工智能,5G,XR,高通,AI

内容概要：作为细分赛道的龙头企业，高通比多数厂商们更早地感受到行业变化，早早在元宇宙做好技术储备，其元宇宙布局已初具雏形。相比其他底层技术厂商，高通凭借着其独一无二专为XR设备设计的芯片平台领先一步。
元宇宙遥不可及？专家：AI是元宇宙重要支撑，已有众多结合及落地案例

发布日期：2022-09-02 信息栏目：科技主题标签：人工智能,WAIC,上海,AI

内容概要：9月1日～9月3日，2022年世界人工智能大会（WAIC）在上海举办。中科智云科学技术委员会的计算机视觉主委科学家、英国皇家工程院院士Philip·Torr（菲利普·托尔）在开幕式演讲中提到，世界前沿AI与元宇宙互相促进，已经有众多相关落地案例。
Meta持续动荡：AI部门拆散重组，杨立昆投身元宇宙部门

发布日期：2022-06-04 信息栏目：经济主题标签：Meta,AI,Facebook,FAIR,人工智能,机器学习

内容概要：自从扎克伯格宣布全面转向元宇宙以来，Meta已经有超过20位核心高管和顶尖AI科学家离职。
“魔珐科技”获1.3亿美元融资元宇宙离《终极玩家》还有多远？

发布日期：2022-05-17 信息栏目：文化主题标签：虚拟人,魔珐科技,AI

内容概要：元宇宙是当下创投市场当之无愧的风口，虚拟人作为入场券其热度也随之攀升，有望成为元宇宙中最先盈利的板块，因此也吸引了众多投资机构、互联网巨头的争相布局。
魔珐科技创始人柴金祥：虚拟人产业迎来井喷推进商业复制时机已到

发布日期：2022-05-09 信息栏目：文化主题标签：虚拟人,AI,魔珐科技

内容概要：既是虚拟人工厂、也是产业平台。魔珐科技能为虚拟人产业带来魔法吗？
《2022年中国虚拟人产业发展白皮书》发布，AI being成为行业共识(附PDF下载)

发布日期：2022-05-07 信息栏目：教育主题标签：虚拟人,元宇宙报告,AI being

内容概要：5月5日，弗若斯特沙利文联合头豹研究院发布了《2022年中国虚拟人产业发展白皮书》（以下简称白皮书），从虚拟人的定义与分类、技术与产品、应用与价值、趋势判断等维度，首次精准阐述了中国虚拟人产业发展的现状与趋势。
「虚拟老黄」骗过你，但你能摸到夏语冰的手？｜新智元「元宇宙，新人类」论坛万字干货

发布日期：2022-04-03 信息栏目：文化主题标签：元宇宙论坛,元宇宙产业,虚拟人,人工智能,AI being

内容概要：3月30日下午，新智元「元宇宙，新人类」论坛大咖云集！新智元杨静、英伟达沈威、万向区块链肖风、小冰李笛、浪潮刘军、STEPVR郭成、清华胡翌霖、蓝驰刘勇等倾情分享，火花四射！
Meta启示：AI是通往元宇宙的关键变量

发布日期：2022-02-28 信息栏目：科技主题标签：Meta,AI,Builder Bot,CAIRaoke,AR,机器翻译

内容概要：数字通感与元宇宙的契合，AI是连通的桥梁，不可或缺，为亿万用户构筑出人机共生共融的新未来。
Meta公司推多个AI项目布局元宇宙

发布日期：2022-02-25 信息栏目：科技主题标签：Meta,AI,Builder Bot,3D化身,CAIRaoke

内容概要：据路透社报道，脸书母公司元公司的首席执行官（CEO）马克·扎克伯格23日表示，公司目前正在推进多个人工智能（AI）项目，以通过语言创造虚拟场景、改善与语音助手的互动以及翻译不同的语言，这将是其元宇宙发展计划中的关键环节。
平台押注资本追捧视听产业成元宇宙场景应用第一战场

发布日期：2023-03-30 信息栏目：文化主题标签：元宇宙文旅,视听,AIGC,元宇宙报告,元宇宙场景

内容概要：报告显示，元宇宙是一个需要长期才能实现的目标，在实现元宇宙的旅程之中会不断地出现像AIGC这样的爆点。有了AIGC支持后，人类至少一只脚已经开始在往真正的元宇宙时代迈进。
武昌区域媒体联盟成立虚拟形象代言人“武畅儿”亮相

发布日期：2023-03-24 信息栏目：文化主题标签：虚拟人,武汉

内容概要：“‘武畅儿’形象的推出，既是武昌创新城区形象宣传的推介手段，也是布局元宇宙新赛道，培育新型文化业态，构建数字文化创意产业生态圈的重要举措。
放弃元宇宙，转型AI？Meta：不，两个我都要

发布日期：2023-03-18 信息栏目：科技主题标签：Meta,Facebook,战略,投资,Horizon Worlds,AI

内容概要：扎克伯格写道，构建元宇宙“仍然是定义社交联系未来的核心”，但 Meta 不会将大部分资金花在元宇宙。
《中国人工智能产业研究报告（Ⅴ）：道阻且长，行而不辍》（附PDF下载）

发布日期：2023-03-14 信息栏目：教育主题标签：AI,人工智能,报告

内容概要：AI成为企业数字化、智能化改革的重要抓手，也是各行业领军企业打造营收护城河的重要方向。落地AI应用对企业业务运营的商业价值与战略意义越来越明确。
加速元宇宙创新生态，阿里云和伙伴一起探寻奇点

发布日期：2023-03-13 信息栏目：经济主题标签：加速器,杭州,阿里,数字人,XR,AI

内容概要：在为期两天的活动中，来自阿里云、大淘系、阿里战投等阿里内部多个团队的相关负责人从不同角度分享了阿里在数字人、XR等与元宇宙主题相关领域的方向和进展，并携手英伟达、声网等生态合作方，积极寻求与入选加速器的企业在技术、产品、解决方案、业务商机等领域的合作可能。同时，来自红杉中国、华映资本等知名投资机构的投资人也齐聚一堂，交流元宇宙领域的投资逻辑，与创业者共话前进方向。
中国 AIGC 与元宇宙创新创业创作大赛即将启动

发布日期：2023-03-03 信息栏目：科技主题标签：AIGC,创新,内容创作,元宇宙竞赛,ChatGPT

内容概要：在实现元宇宙的过程中，会不断出现像AIGC这样的爆点，而我们将通过大赛的方式去追踪，用大赛去覆盖元宇宙成长过程中的每一个关键技术突破。
Unity中国亮相2023全球人工智能开发者先锋大会

发布日期：2023-02-26 信息栏目：科技主题标签：人工智能,Unity,开发者大会,GAIDC

内容概要：作为早已前瞻性在AI领域布阵的实时3D引擎，Unity不仅深度参与峰会，展示了Unity+AI在汽车、数字人、元宇宙等领域已呈现的成熟解决方案；同时也在AIGC这一人工智能的重要领域，阐述了3D技术目前所面临的挑战及即将为全行业带来的生产力革命。
各大企业巨亏裁员，元宇宙会是又一个泡沫吗？

发布日期：2023-02-25 信息栏目：社会主题标签：ChatGPT,AIGC,人工智能

内容概要：元宇宙真的“凉了”吗？它会是又一个资本吹起的泡沫吗？
ChatGPT，将元宇宙拍在沙滩上？

发布日期：2023-02-22 信息栏目：科技主题标签：ChatGPT,人工智能,OpenAI

内容概要：“长江后浪推前浪，ChatGPT将元宇宙拍在沙滩上。”在ChatGPT火爆出圈的同时，近年“新贵”元宇宙则显落寞。
“元宇宙跨年晚会”新玩法：元宇宙、虚拟人全上线

发布日期：2023-01-01 信息栏目：文化主题标签：虚拟人,元宇宙晚会

内容概要：从2022年12月31日开始，有超10档跨年晚会、音乐会“争奇斗艳”。央视、卫视、互联网平台同台竞技，就连元宇宙、虚拟人也来凑热闹，打出“元宇宙跨年”新玩法。

更多相关主题：虚拟人手语主播 AI

上一篇
“超写实数字人”AYAYI 完全无法辨别真假，数字人要抢真人饭碗啦

下一篇
莱斯米尔斯正通过VR拳击游戏进入元宇宙

上一篇：“超写实数字人”AYAYI 完全无法辨别真假，数字人要抢真人饭碗啦

下一篇：莱斯米尔斯正通过VR拳击游戏进入元宇宙