<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>三堵墙 | 行业新闻_数智（点击查看更多）</title><description>搜索引擎 + AI 驱动的行业新闻【覆盖行业】信保 ｜出口 ｜金融 制造 ｜农业 ｜建筑 ｜地产  零售 ｜物流 ｜数智【访问入口】hangyexinwen.com【新闻分享】点击发布时间即可分享【联系我们】xinbaoren.com（微信内打开提交表单）</description><link>https://shuzhi.hangyexinwen.com</link><item><title>⁣📰 24小时直播，只靠一张照片？虎牙实时多模态数字人VAM 1.0率先突围行业三堵墙本文介绍了虎牙最新推出的虎牙VAM 1.0（Vivid Avatar Model），通过DiT架构实现的实时多模态数字人基础模型</title><link>https://shuzhi.hangyexinwen.com/posts/20614</link><guid isPermaLink="true">https://shuzhi.hangyexinwen.com/posts/20614</guid><pubDate>Tue, 30 Jun 2026 11:44:20 GMT</pubDate><content:encoded>⁣&lt;br /&gt;&lt;b&gt;&lt;i&gt;&lt;b&gt;📰&lt;/b&gt;&lt;/i&gt; 24小时直播，只靠一张照片？虎牙实时多模态数字人VAM 1.0率先突围行业三堵墙&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;本文介绍了虎牙最新推出的虎牙VAM 1.0（Vivid Avatar Model），通过DiT架构实现的实时多模态数字人基础模型。仅需上传一张照片就能生成一个能说话、听你说话、会唱跳的全能AI数字人，且在线上直播时能实时互动。实测显示其在聊天、唱歌、跳舞、换装、玩塔罗和狼人杀等场景中表现稳定、自然，具备“静默-聆听-说话”三种状态的全状态拟人交互，并支持实时打断和弹幕语音双链路。文章还详细解析了这项技术面临的三堵墙：时间、交互、部署，并阐述虎牙如何通过三阶段训练、DPO偏好优化、模型蒸馏等方法实现持续24小时在线、低延迟的性能。最终结论是虎牙VAM 1.0以稳、准、快为核心能力，且将AI数字人从“内容生产工具”向“实时交互主体”转变，具备广阔的直播、新闻播报、虚拟演唱会等场景落地潜力。未来，AI数字人将成为直播系统的核心组成部分，而虎牙在场景、技术与工程化上的布局显著领先。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🏷️&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;/search/%23AI%E6%95%B0%E5%AD%97%E4%BA%BA&quot;&gt;#AI数字人&lt;/a&gt; &lt;a href=&quot;/search/%23%E8%99%8E%E7%89%99VAM&quot;&gt;#虎牙VAM&lt;/a&gt; &lt;a href=&quot;/search/%23%E5%AE%9E%E6%97%B6%E4%BA%92%E5%8A%A8&quot;&gt;#实时互动&lt;/a&gt; &lt;a href=&quot;/search/%23%E7%9B%B4%E6%92%AD%E5%9C%BA%E6%99%AF&quot;&gt;#直播场景&lt;/a&gt; &lt;a href=&quot;/search/%23%E4%B8%89%E5%A0%B5%E5%A2%99&quot;&gt;#三堵墙&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://www.qbitai.com/2026/06/440236.html&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;</content:encoded></item></channel></rss>