当前位置:首页 > 科技资讯 > 正文

AI大模型重塑数字人生态:挑战与机遇并存

AI大模型重塑数字人生态:挑战与机遇并存 AI大模型 数字人 3D技术 平台化 第1张

2021年,数字人如“柳夜熙”在直播间、广告及影视中崭露头角,一度成为热议话题。然而,随着AI大模型的兴起,相关讨论逐渐转向AI智能体与助手。这背后隐藏着怎样的行业变迁?

理论上,大模型的崛起增强了3D数字人的对话能力,对其商业化应用理应有所助益。但为何现实进展缓慢?

一位AI虚拟陪伴领域的创业者向界面新闻透露,市场上数字人公司数量减少的关键原因是缺乏AI能力。在3D数字人领域,大模型的爆发反而对公司提出了更高要求。

据中商产业研究院报告,2024年2D数字人迅速落地,市场占比达70.1%,而3D数字人市场份额较小,仅占29.9%。这主要因为3D数字人技术迭代速度受限。

一位与多家数字人公司合作的LED显示屏厂商CEO指出,数字人行业存在产品质量不一、GPU成本高及服务不稳定等问题,难以实现全天候无差错服务。

魔珐科技作为较早入局3D数字人的公司,其创始人兼CEO柴金祥教授认为,许多公司被淘汰是因为在AI大模型规模化时,数字人的能力未能与之匹配。“大模型是语言能力,而数字人是身体能力,若大脑强大而身体弱小,则无用。”柴金祥强调,许多数字人公司未走AI研发路线,能力自然受限。

柴金祥拥有美国卡内基梅隆大学人工智能与机器人专业博士学位,自二十多年前便开始研究3D数字人。他向界面新闻表示,未来要做好3D数字人,需积累高质量数据、储备稀缺人才及具备强大美术能力。

然而,在数据与人才方面,数字人公司均面临瓶颈。例如,目前文生图片和视频等数据丰富,但涉及人体动作与环境交互的3D数据仍稀缺,且多数公司缺乏数据积累能力。此外,柴金祥提到,从事3D内容与AI研究的人才历来“割裂”,难以将两者结合。

大模型的爆发加速了行业洗牌与分化。一个明显趋势是,3D数字人的制作正趋向平台化。

平台化的前提是市场接受度。一位行业人士透露,目前许多提供数字人方案的公司集中在展馆、文旅景区及教育培训等场景,工具属性更强。这得益于政策扶持——今年各地发布鼓励AI发展的战略,促使众多机构重视数字化应用。

更重要的是,AI技术的进步降低了整个产业链成本,使规模化成为可能。

受限于质量、成本及延时等问题,以往3D数字人难以大规模应用。但如今情况已不同。IDC中国人工智能研究经理程荫在报告中指出,在生成式AI与大模型技术驱动下,AI数字人的技术架构得以升级:头部厂商依托语义与垂直领域大模型构建新一代数字人技术栈;多模态能力持续突破,表情生成、动作捕捉、语音合成及视觉理解等关键技术模块通过超大规模预训练获得提升。此外,AI普及也降低了终端设备部署数字人的成本。

基于自主研发的文生多模态3D大模型及云-端协同架构,魔珐科技近期推出了具身智能3D数字人开放平台供开发者使用。据魔珐科技公开演示显示开发者可在3分钟内完成数字人接入。目前该开发平台已在数字人客服、培训助手及导购等岗位实现应用。

早在2021年接受界面新闻采访时柴金祥就提到公司发展方向为平台化但直到如今技术条件才逐渐成熟。柴金祥认为伴随智能化升级近年来AI已能写文章、编程序甚至做决策并能调用各种API成为智能体但AI仍缺乏“身体”。根据他判断拥有大模型支撑下“大脑”3D数字人更大市场是扮演白领角色而开放平台可成为基础设施。

今年8月聚焦数字人领域影眸科技完成新一轮数千万美金融资宣布将在其3D生成平台中上线百亿参数级新模型。百度则在今年发布数字人技术nova同样向平台化发展。

从走进大众视野到成为风口再到受到外界质疑数字人的商业模式一直是核心议题这不仅涉及技术进步还有伦理边界。今年618期间罗永浩数字人在百度电商开播开播26分钟GMV超真人带货1小时。但从2024年起不同平台已相继发布规则进行监管数字人主播并未如预期普及。

可以确定的是更多开放平台出现将降低数字人制作门槛但如何在AI时代发挥数字人作用与诸多AI应用发展一样尚无定论。