📰 京东发布“自由态数字人”JoyStreamer
京东数字人团队推出的自由态数字人JoyStreamer在核心技术上取得显著进展,具备自然走动、动态摆姿等高度拟人化动作,能够覆盖电商直播、文旅讲解等20多个行业场景,应用潜力巨大。该系统采用“音频、文本”双教师DMD后训练方法,无需额外训练数据即可实现精准控制;同时通过动态CFG调制策略解决文本与音频多模态控制冲突,避免声画不同步的问题。在长视频方面,京东自研的“历史帧+伪最后一帧”结构有助于稳定生成30秒以上的高质量长视频。面对文本控制能力弱、音视频不同步、长视频生成能力欠缺等行业痛点,JoyStreamer为数字人产品提供了系统性解决思路,推动数字人从概念走向大规模应用。此外,京东还上线了“数字人直播间复刻”功能,商家仅需上传真人直播素材,即可精准复刻主播形象、声线和直播间布景,大幅降低内容制作门槛,促进直播运营转化为长期资产。
🏷️ #数字人 #JoyStreamer #AI直播 #多模态 #长视频
🔗 原文链接
📰 京东发布“自由态数字人”JoyStreamer
京东数字人团队推出的自由态数字人JoyStreamer在核心技术上取得显著进展,具备自然走动、动态摆姿等高度拟人化动作,能够覆盖电商直播、文旅讲解等20多个行业场景,应用潜力巨大。该系统采用“音频、文本”双教师DMD后训练方法,无需额外训练数据即可实现精准控制;同时通过动态CFG调制策略解决文本与音频多模态控制冲突,避免声画不同步的问题。在长视频方面,京东自研的“历史帧+伪最后一帧”结构有助于稳定生成30秒以上的高质量长视频。面对文本控制能力弱、音视频不同步、长视频生成能力欠缺等行业痛点,JoyStreamer为数字人产品提供了系统性解决思路,推动数字人从概念走向大规模应用。此外,京东还上线了“数字人直播间复刻”功能,商家仅需上传真人直播素材,即可精准复刻主播形象、声线和直播间布景,大幅降低内容制作门槛,促进直播运营转化为长期资产。
🏷️ #数字人 #JoyStreamer #AI直播 #多模态 #长视频
🔗 原文链接