⁣📰 SentiPulse携手人大高瓴：开源交互式3D数字人框架SentiAvatar，领跑行业主流模型-品玩3D数字人行业当前面临的瓶颈并非单纯的外观美观问题，而是难以建立与人类自然表达、顺畅动作及情感交流相匹配的深度交互能力

⁣
📰 SentiPulse携手人大高瓴：开源交互式3D数字人框架SentiAvatar，领跑行业主流模型-品玩

3D数字人行业当前面临的瓶颈并非单纯的外观美观问题，而是难以建立与人类自然表达、顺畅动作及情感交流相匹配的深度交互能力。尽管建模和渲染越来越精细，数字人仍常出现动作与语义脱钩、面部表情与台词情绪不一致等现象，造成机械感与违和感，严重阻碍情感联结与长期交互。文章指出中文高质量对话数据稀缺、复合语义下动作漂移以及音画节奏错位是核心三大瓶颈，将数字人困在“预设脚本播放机器”的定位中。为打破这一格局，SentiPulse联合人民大学高瓴AI学院推出SentiAvatar，提供全球开源的3D动作生成解决方案，旨在实现情境与情绪自然而实时的交互，摆脱提线木偶的局限。其底层数据由SuSuInterActs数据集支撑，涵盖2.1万段片段、37小时多模态对话语料与全身动作、面部表情等标注，填补中文高质量数据空白。通过Motion Foundation Model提供通用运动先验，和plan-then-infill双通道架构实现动作与表情分步规划与逐帧执行，显著提升生成流畅度与跨场景泛化能力。实验显示SentiAvatar在SuSuInterActs与BEATv2数据集上均达到SOTA，文本-动作检索召回率和跨语言评测指标均处于行业领先，并能在0.3秒内生成6秒动作序列，支持无限轮次的流式互动，解决数字人“交互卡顿”问题。该框架已开源于GitHub，面向全球研究者，推动在游戏、影视、机器人等领域的落地应用，推动数字人从“冰冷工具”向能理解情境、反馈情绪、主动表达的交互主体转变，开启下一代数字生命。

🏷️ #数字人 #SentiAvatar #交互 #动作生成 #开源

🔗 原文链接