36kr-科技 10月30日 22:37
AI大模型浪潮下的3D数字人:挑战与机遇并存
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

2021年,数字人曾一度成为风口,但随着大模型出现,市场焦点转向AI智能体和AI助手。尽管大模型理论上能增强3D数字人的对话能力,但现实中,许多数字人公司因缺乏AI能力而面临淘汰。目前2D数字人市场占比较高,3D数字人受技术迭代速度限制。行业面临产品质量参差不齐、GPU成本高、服务不稳定等问题。魔珐科技创始人柴金祥指出,大模型是“大脑”,数字人是“身体”,身体能力若跟不上大脑,则难以发挥作用。3D数字人发展瓶颈在于高质量数据和稀缺人才。当前行业趋势是3D数字人制作平台化,市场接受度在展馆、文旅、教育等领域逐渐提升,政策加持和AI技术进步降低了成本。生成式AI和大模型技术正驱动AI数字人技术架构升级,多模态能力突破,表情、动作、语音、视觉等关键技术模块提升了数字人的形象、交互和决策能力。魔珐科技已推出具身智能3D数字人开放平台,百度发布数字人技术nova,均走向平台化。数字人的商业模式仍是核心命题,涉及技术进步与伦理边界。更多开放平台将降低制作门槛,但其在AI时代的作用尚待明确。

🚀 **AI大模型驱动下的行业洗牌与能力重塑**:大模型的爆发对3D数字人行业提出了更高的AI能力要求。许多曾一度流行的数字人公司因未能跟上AI技术发展,特别是缺乏与大模型相匹配的“身体”能力,面临淘汰。这加速了行业的洗牌和分化,迫使企业重新审视和提升自身的核心AI技术实力。

💡 **2D数字人主导与3D数字人技术瓶颈**:当前市场以2D数字人为主导,占据70.1%的市场份额,而3D数字人份额较小(29.9%)。3D数字人面临技术迭代速度慢、产品质量参差不齐、GPU成本高、服务不稳定等核心难题,限制了其大规模落地应用。

🌐 **平台化趋势与市场接受度提升**:为了克服技术和成本障碍,3D数字人制作正向平台化发展。这种趋势得益于政策对人工智能发展的支持,以及在展馆、文旅、教育等场景中日益增长的市场接受度。平台化降低了制作门槛,使得规模化应用成为可能。

🔧 **技术进步赋能AI数字人升级**:生成式AI和大模型技术正驱动AI数字人技术架构升级。通过超大规模预训练,多模态能力(表情生成、动作捕捉、语音合成、视觉理解等)持续突破,显著提升了数字人的形象逼真度、交互自然度和自主决策能力。同时,AI普及也降低了终端设备部署成本。

🤝 **开放平台与未来发展方向**:以魔珐科技和百度为代表的公司正积极构建3D数字人开放平台,旨在降低开发者接入数字人的门槛。这种平台化战略被视为未来发展的重要方向,有望让AI数字人更好地扮演“白领”等角色,成为重要的基础设施。

2021年,各种数字人开始出现在直播间、广告画面和影视短剧中,横空出世的“柳夜熙”一度让数字人成为风口。但在大模型出现之后,谈论这一概念的公司却在减少,取而代之的是AI智能体、AI助手。

理论上来说,大模型的爆发实际上让3D数字人拥有更强的对话能力,对其商业化应用也会有所助力。但现实情况为何并非如此?

一位从事AI虚拟陪伴的创业者向界面新闻表示,市场上的数字人公司越来越少,核心原因在于没有AI能力。尤其是在3D数字人领域,大模型的爆发实际上对公司提出了更高的要求。

中商产业研究院发布的报告显示,2024年2D数字人落地较迅速,市场占比达到70.1%。3D数字人市场份额较小,占比29.9%。核心原因就在于,3D数字人仍受限于技术的迭代速度。

一位和多家数字人公司合作过的LED显示屏厂商CEO向界面新闻表示,数字人行业存在一个现象:头部公司产品优秀,但整个行业产品质量参差不齐,且GPU成本较高、服务不稳定,难以实现7×24小时无差错服务。

曾做出国风虚拟人“翎Ling”的3D数字人公司魔珐科技入局较早,是留在牌桌上的公司之一。对于行业的变化,魔珐科技创始人兼CEO柴金祥教授认为,很多公司之所以被淘汰,就是因为在AI大模型已经规模化的时候,数字人的能力却没有匹配上大模型。“大模型是语言能力,数字人是身体的能力,如果大脑很强,身体配不上,当然就没有用。”柴金祥直言,此前很多数字人公司没有走AI研发的路线,能力也会相对受限。

柴金祥拥有美国卡内基梅隆大学人工智能与机器人专业博士学位,二十多年前开始3D数字人相关研究。他在接受界面新闻采访时表示,未来想要做好3D数字人,需要高质量数据积累、稀缺人才储备以及强大的美术能力等等。

但无论是在数据还是人才方面,数字人公司都存在一定瓶颈。例如在数据层面,目前文生图片和视频等数据已经相对丰富,但涉及人体动作和环境交互的3D数据仍然较为稀缺,而大部分公司没有积累数据的能力。此外,柴金祥提到,一直以来,做3D内容和研究AI的人才就是“割裂”的,将两种类型的人才聚集到一起也有难度。

大模型的爆发加速了行业的洗牌和分化。当下的一个趋势是,3D数字人的制作开始向平台化发展。

平台化的前提是市场的接受程度。一位行业人士告诉界面新闻,目前很多提供数字人方案的公司,落地领域都集中在展馆、文旅景区、教育培训等场景,工具化的属性更强。这离不开政策的加持——今年以来,各地发布鼓励人工智能发展的战略,促使很多机构重视数字化的应用。

更重要的是,AI技术的进步加速了整个产业链成本的降低,让真正的规模化成为可能。

受限于质量、成本、延时三个难题,以往3D数字人无法大规模应用。但如今情况有所不同。IDC中国人工智能研究经理程荫在一份报告中表示,在生成式AI和大模型技术的驱动下,AI数字人的技术架构升级:头部厂商依托语义和垂直领域大模型,构建起新一代数字人技术栈;多模态能力持续突破,表情生成、动作捕捉、语音合成、视觉理解等关键技术模块通过超大规模预训练,推动数字人在形象、交互和自主决策等方面的提升。此外,AI的普及,也降低了很多终端设备部署数字人的成本。

基于自主研发的文生多模态3D大模型及云-端协同架构,魔珐科技近期上线了具身智能3D数字人开放平台,供开发者使用。根据魔珐科技的公开演示,开发者可以在3分钟内完成数字人接入。据界面新闻了解,目前这一开发平台在数字人客服、培训助手、导购等岗位实现应用。

在2021年接受界面新闻采访时,柴金祥就提到公司的发展方向是平台化。但直到现在,技术条件才逐渐成熟。柴金祥认为,伴随着智能化的升级,近几年来AI已经可以写文章、编程序甚至做决策,并且可以调用各种API成为智能体,但AI依然缺少“身体”。按照他的判断,有了大模型支撑下的“大脑”,3D数字人更大的市场是扮演白领的角色,而开放平台可以成为基础设施。

今年8月,聚焦数字人领域的影眸科技完成新一轮数千万美金融资,宣布将在其3D生成平台中上线百亿参数级新模型。百度则在今年发布数字人技术nova,同样往平台化发展。

从进入大众视野到成为风口,再到逐渐受到外界质疑,数字人的商业模式始终是核心命题,但这不仅涉及技术的进步,还有伦理边界。今年618期间,罗永浩数字人在百度电商开播,开播26分钟的GMV超过真人带货1小时。但是从2024年开始,不同平台已相继发布规则进行监管,数字人主播并未如想象中普及。

可以确定的是,更多开放平台的出现,将降低数字人制作的门槛。但数字人将如何在AI时代发挥作用,和诸多AI应用的发展一样尚无定论。

本文来自微信公众号“界面新闻”,作者:佘晓晨,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

数字人 AI 大模型 3D数字人 虚拟人 人工智能 技术趋势 平台化 Digital Humans AI Large Models 3D Digital Humans Virtual Humans Artificial Intelligence Technology Trends Platformization
相关文章