虚谷未来CEO 唐佳娴:让虚拟人“灵” 动起来

本文涉及的产品
轻量应用服务器 2vCPU 4GiB,适用于网站搭建
轻量应用服务器 4vCPU 16GiB,适用于搭建游戏自建服
轻量应用服务器 2vCPU 1GiB,适用于搭建电商独立站
简介: 精致画质、灵活操控、实时渲染及互动。

image003.jpg

图:2022阿里云视觉计算私享会现场


5月11日,在“2022阿里云视觉计算私享会”上,数字王国集团虚谷未来科技CEO唐佳娴为大家带来了题为《让虚拟人“灵”动起来》的主题分享。以下内容根据她的演讲整理而成。

image001.png


2008年 ,数字王国首次创新“虚拟人”技术并运用于电影《返老还童》。2012 年,我们首次将虚拟人搬上舞台,在科契拉音乐节“复活”已故美国饶舌歌手Tupac,轰动全美。此后,2014年,我们在亚洲市场“复活”了邓丽君。2018 年,我们展现了具备业内领先优势的高拟真虚拟人DigiDoug。


在虚拟人发展的早期,一般需要借助虚拟人的模型,加上后期特效来完成整个虚拟人的呈现。到了 2019 年,我们实现了所见即所得、实时渲染的高画质虚拟人


基于这个转折点,我们更多地将此技术落地于商业应用,有与芝加哥博物馆合作的复活马丁路德金,也有国内市场的班长小艾等一系列角色。


虚谷未来是数字王国做虚拟人商业化的专业公司。在近两三年的实际探索中,我们发现,除了高品质虚拟人的制作需要丰富的技术经验,在虚拟人市场应用技术也非常有必要匹配相应的解决方案,从而实现虚拟人“高品质、轻应用、低成本”的商业落地。我们专注将虚拟人的制作、应用、运营全栈一体化发展,实现虚拟人日常高频次、量化产出内容,提供为各品牌、机构的高性价比服务。

image003.png


上图是虚拟人静态模型,包括卡通、2次元、 2.5 次元及风格化、游戏级、拟真人、写实级、电影级7-8档。

image005.png


动态模式主要有以下三类:


  • 动画:依靠传统特效,包括全 3D 以及真人实拍加部分 3D,这是传统特效的应用方式。


  • 人力动捕:由真人穿戴专业动捕设备,通过光学捕捉和惯性捕捉来驱动模型。主要考验3D模型资产的绑定以及驱动的算法能力及经验;另外,还有通过视频相机捕捉真人表情、动态的方式,做模型的驱动,比较便捷,便可驱动的模型精细级别有限。


  • 算力动态:不需要真人动捕操作,虚拟人的面部和身体动态、语言表达全都通过 3D 数字化操作。例如,我们与跟阿里达摩院合作的虚拟主播完全应用数字化驱动;除此之外,还有用 2D 真人照片、视频的形式,主要解决口型和相对固定部分身体动作的动态呈现。

image007.png


上图展示了真人拍摄+换头特效的方式。在日常运营中,虚拟人与复杂空间、人物同框交集的视频需要,以及平面物料变化丰富的服装,大多采取此种方式实现。

image009.png


上图左侧展示了穿着专业动捕服来做数字人的驱动。右侧为通过相机、电脑摄像头捕捉真人表情及动作,从而操控虚拟人,多应用于虚拟角游戏级别以下的虚拟人。

image011.png


上图为算力驱动,也是数字王国虚谷未来与阿里达摩院合作的项目。上图中主播的身体、表情和语言全部通过数字驱动呈现,它还接入了淘宝客服系统,能够自动发放优惠券、回答观众提问。因此,虚拟主播与真人主播是非常好的搭档。白天真人主播上线,24点后虚拟人主播可设置自动上线直播,大大降低了人力成本,提高品效;对直播间的权重以及产出来说,是非常优秀的组合。

image013.png


算力动态的2D 建模,使用真人照片的面部合成为新的虚拟脸型及身体形象,主要集中在口唇部的动态及简单身体动态的配合,应用成本相对低,但虚拟感会相对弱。

image015.png


AI 智能化包括 2D 真人照片、各类级别的 2D/3D 虚拟人,可以分为两类:


  • 第一类:固定的知识图谱加上固定的声音、表情、动作组合。知识图谱是系统设置好的声音、表情、动作,由虚拟人去执行设定好的内容,实现去人化AI动态。


  • 第二类:更高级别的知识图谱,虚拟人可以通过算法进行学习,包括表情、动作的动态和语言内容,最终实现的效果是虚拟人所有的表现和思考、表达都通过虚拟人自我学习达成,是一个真正的 AI 智慧人。

image017.png


上图为数字王国超写实虚拟人Digi Doug与真实人类进行互动,他的声音、表情动作、表达都是通过自己学习而成。


数字王国虚谷未来一直以来,专注于高品质虚拟人的制作和运营,而业内的其他伙伴也都在各自的细分领域里精耕细作。根据不同的应用场景,运用不同的虚拟人制作和应用模式才是最佳组合。希望业内的伙伴们一起联合共创以及协作。

image019.png


比如市场物料的平面和视频,可以通过动画特效与实景或全虚拟景结合,能呈现出更精质的大片效果;虚拟人直播可以通过优质的虚拟人实时驱动技术+中之人的表现,使虚拟人更具人性化和亲和力;在自媒体运营、短视频的场景应用,需要便利、低成本、高频次地输出内容,更多也是应用这种模式。而虚拟客服可以运用全AI的模式为客户提供最低成本的24小时实时服务。


未来,虚拟人的两个发展趋势一定是高品质的表现力以及智能化应用。

image021.png


而高品质的标准有三:

  • 第一,精细、超写实的画质。
  • 第二,能够高灵活度地操控表情、动作、材质等。
  • 第三,实时渲染,即,实时实现前两项高品质、高灵活度的实时驱动。这是比较大的挑战。

image023.jpg


数字王国虚谷未来的虚拟人,已实现了电影级虚拟人面部表情的实时灵动,包括眼球级的实时灵活追踪。


上图,虚拟人艾博爷爷脸上的皱纹细节、眼睫毛细致逼真,具有超写实质感,呈现了电影级的写实程度,且实现了实时渲染。这些优秀的表现都源自于数字王国数字王国独特的虚拟人实时式驱动系统。

image025.png


除了表情和动作,服装的动态算法也至关重要。比如班长小艾的双层纱裙,动态下能呈现非常灵动飘逸的质感,非常考验材质的算法。

image027.png


我们于2019年在温哥华 TEDTalk 首次实现了虚拟人形式演讲,全程由本人实时操控虚拟人完成。


因此,数字王国的核心技术就是实时动捕驱动虚拟系统


image029-调整大小.png

image031.jpg



以上为数字王国虚谷未来的虚拟人案例。

image033.jpg


目前虚拟人在大文娱、快消、客服类和近期快速发展的数字NFT领域,尤其 NFT 后来居上,虚拟人已经成为所有品牌方应用的重要形式。


让一个虚拟人灵动起来,包括灵活的动作和灵魂,虚拟人的灵魂需要通过内容输出来表达。因此,便捷和量产非常关键。应用上来看,不管是直播、视频还是实时活动,高品质、轻量级以及低成本非常重要。如果需要花费很长时间和高制作成本才能输出一条视频,不利于虚拟IP的打造,不能满足日常化应用的实际需求。


目前我们的系统已经能够实现一台专业电脑,加一个技术人员和一个中之人,即可完成整场直播的表现输出,完美解决自媒体和品牌方的需求。


虚拟人还可以应用到产品包装、活动发布、演出等场景,通过AR技术实现互动、通过线下全息类装置实现虚拟人沉浸式展示和服务,通过 XR 的方式来呈现的线上/线下发布会、综艺表演也非常精彩。


image035.png

image037.png

image039.png



当前我们正处于 web 3.0 的初始阶段,它更是一个品牌数字营销的升级关键期。因此,品牌拥有一个虚拟人或个人拥有一个数字分身是大势所趋,因为这是进入元宇宙、新数字化营销的基础。


希望在不久的将来,通过业内各伙伴的合作,每个品牌能够快速拥有专属的高品质品牌虚拟人,每个人都能拥有自己的个人数字分身


点击这里,查看本次视觉计算私享会的回放视频


相关文章
|
JavaScript 前端开发 Java
10分钟邮箱API发送邮件的操作步骤
使用10分钟邮箱API发送邮件涉及6步:获取API密钥、导入相应库、设置请求参数、发送API请求、处理响应及检查收件箱。适用于自动化邮件发送,如测试和临时通知。[≤240字符]
|
Kubernetes 关系型数据库 MySQL
ChaosBlade常见问题之数据库进行故障注入报错ibdata1文件异常如何解决
ChaosBlade 是一个开源的混沌工程实验工具,旨在通过模拟各种常见的硬件、软件、网络、应用等故障,帮助开发者在测试环境中验证系统的容错和自动恢复能力。以下是关于ChaosBlade的一些常见问题合集:
313 1
|
4月前
|
Kubernetes 监控 Serverless
基于阿里云Serverless Kubernetes(ASK)的无服务器架构设计与实践
无服务器架构(Serverless Architecture)在云原生技术中备受关注,开发者只需专注于业务逻辑,无需管理服务器。阿里云Serverless Kubernetes(ASK)是基于Kubernetes的托管服务,提供极致弹性和按需付费能力。本文深入探讨如何使用ASK设计和实现无服务器架构,涵盖事件驱动、自动扩展、无状态设计、监控与日志及成本优化等方面,并通过图片处理服务案例展示具体实践,帮助构建高效可靠的无服务器应用。
|
5月前
|
缓存 Linux
CentOS-6的iso下载地址镜像yum源
通过上述步骤,您可以成功下载CentOS 6的ISO镜像文件,并配置适用于CentOS 6的YUM源。尽管CentOS 6已经停止更新,但使用这些镜像和YUM源配置,可以继续在需要的环境中使用和维护CentOS 6系统。
2205 20
|
存储 SQL 多模数据库
深度剖析数据库技术:核心原理、应用场景及未来趋势
一、引言 在信息化时代,数据库技术已成为各行各业不可或缺的一部分
|
关系型数据库 MySQL
navicate远程mysql时报错: connection isbeing used
如果以上方法都无法解决问题,可能需要进一步查看错误日志或考虑联系 Navicat 官方支持获取更详细的帮助。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
1132 0
|
机器学习/深度学习 人工智能 算法
这篇科普让你Get所有大模型的基础核心知识点
本文介绍了AI大模型的概念和发展历程。AI大模型是指具有1亿以上参数的机器学习模型,通过在大规模数据集上进行预训练,可以直接支撑各类应用。大模型的发展经历了从萌芽期到AI1.0时期,再到AI2.0时期的飞跃,目前最新发布的大模型参数已经达到了千亿甚至万亿级别。国内外的公司都在积极研发和应用大模型,如OpenAI、Google、Facebook、Microsoft等。国内也有百度、阿里巴巴、万维、商汤科技等公司发布了自己的大模型产品。大模型的建造离不开算力资源、算法人才、数据积累等核心要素。此外,文章还列举了一些与大模型相关的专业名词,如算法、模型参数、训练数据、Token等。
|
存储 关系型数据库 MySQL
OSZAR »