📰 AI 技术下沉消费级场景,Soul 上市进程拓宽产业应用空间_中华网

Soul AI Lab 发布的 SoulX-FlashHead 以1.3B参数实现高保真实时数字人,在消费级显卡(如 RTX 4090)上达到96FPS的推理速度,同时提供高画质与低成本并存的解决方案。该模型通过双向蒸馏机制与上帝视角教师模型进行强约束,结合8秒记忆的时序音频上下文缓存,显著提升口型与视频稳定性,解决了“小模型没好画质”的行业痛点。核心还原了高质量数据底座:自研 VividHead 数据集通过严格筛选与多步处理,提供干净的训练素材,使得在HD105等权威数据集上的指标提升明显,Pro版本在HDTVF等评测中表现突出。Lite版本实现单卡低显存高帧率,最高支持3路并发,达到接近实时的体验;Pro版本画质虽略低于大模型,但在8.31的FID与103.14的FVD等指标上刷新纪录,口型同步达到新高度。SoulX-FlashHead 将高保真技术从算力机房带到个人工作站,促进7x24h矩阵直播、游戏NPC引擎、AI外教等多场景应用,推动数字人技术的普惠化落地,同时强化 Soul 的技术竞争力与产业价值认知。

🏷️ #数字人 #高保真 #轻量化 #实时推理 #普惠化

🔗 原文链接
 
 
Back to Top