📰 SentiPulse携手人大高瓴:开源交互式3D数字人框架SentiAvatar,领跑行业主流模型-品玩

3D数字人行业当前面临的瓶颈并非单纯的外观美观问题,而是难以建立与人类自然表达、顺畅动作及情感交流相匹配的深度交互能力。尽管建模和渲染越来越精细,数字人仍常出现动作与语义脱钩、面部表情与台词情绪不一致等现象,造成机械感与违和感,严重阻碍情感联结与长期交互。文章指出中文高质量对话数据稀缺、复合语义下动作漂移以及音画节奏错位是核心三大瓶颈,将数字人困在“预设脚本播放机器”的定位中。为打破这一格局,SentiPulse联合人民大学高瓴AI学院推出SentiAvatar,提供全球开源的3D动作生成解决方案,旨在实现情境与情绪自然而实时的交互,摆脱提线木偶的局限。其底层数据由SuSuInterActs数据集支撑,涵盖2.1万段片段、37小时多模态对话语料与全身动作、面部表情等标注,填补中文高质量数据空白。通过Motion Foundation Model提供通用运动先验,和plan-then-infill双通道架构实现动作与表情分步规划与逐帧执行,显著提升生成流畅度与跨场景泛化能力。实验显示SentiAvatar在SuSuInterActs与BEATv2数据集上均达到SOTA,文本-动作检索召回率和跨语言评测指标均处于行业领先,并能在0.3秒内生成6秒动作序列,支持无限轮次的流式互动,解决数字人“交互卡顿”问题。该框架已开源于GitHub,面向全球研究者,推动在游戏、影视、机器人等领域的落地应用,推动数字人从“冰冷工具”向能理解情境、反馈情绪、主动表达的交互主体转变,开启下一代数字生命。

🏷️ #数字人 #SentiAvatar #交互 #动作生成 #开源

🔗 原文链接
 
 
Back to Top