📰 张向宏:以“工厂化”释放数据价值 破解AI应用落地瓶颈_嘉宾观点_数字中国建设峰会
在第九届数字中国建设峰会的“数字福建”分论坛上,北京交通大学的张向宏提出了“数据工厂”这一新型生产业态,强调数据要素化在人工智能落地中的核心作用。文章回顾,自国家数据局成立以来,数据确权、流通、交易等工具箱逐步完善,但数据资源的开发与商业化模式仍略显薄弱。随着研究深入,数据要素的最终出口已明确,即通过高质量数据集推动人工智能在千行百业的应用,形成“原始数据—基础大模型—高质量数据集—智能体与垂直模型—行业应用”的产业链闭环,成为主流商业化路径。当前AI应用多处于“玩”的阶段,距离深度赋能仍有差距,核心原因是高质量、经过精细化处理的数据集不足。为破解瓶颈,张向宏提出了数据工厂概念,类比农场与工厂的生产模式,作为规模化生产“高能量数据”的核心载体。数据工厂应具备集中/分布式形态,覆盖数据清洗、合成、增强、标注、质检等工艺,产出可直接用于垂直大模型对齐与推理的产品。其落地路径包括数据标注企业升级、算力中心向数据工厂转型、AI企业延伸至前端数据生产,以及创新型技术企业的崛起。最后,建议在国家或区域层面统筹部署数据工厂,与数据基础设施紧密衔接,在底层建设公共数据工厂、行业公共数据工厂,并在流通利用设施中布局专属数据工厂,形成体系化支撑。
🏷️ #数据工厂 #高质量数据集 #智能化应用 #数据要素 #产业链
🔗 原文链接
📰 张向宏:以“工厂化”释放数据价值 破解AI应用落地瓶颈_嘉宾观点_数字中国建设峰会
在第九届数字中国建设峰会的“数字福建”分论坛上,北京交通大学的张向宏提出了“数据工厂”这一新型生产业态,强调数据要素化在人工智能落地中的核心作用。文章回顾,自国家数据局成立以来,数据确权、流通、交易等工具箱逐步完善,但数据资源的开发与商业化模式仍略显薄弱。随着研究深入,数据要素的最终出口已明确,即通过高质量数据集推动人工智能在千行百业的应用,形成“原始数据—基础大模型—高质量数据集—智能体与垂直模型—行业应用”的产业链闭环,成为主流商业化路径。当前AI应用多处于“玩”的阶段,距离深度赋能仍有差距,核心原因是高质量、经过精细化处理的数据集不足。为破解瓶颈,张向宏提出了数据工厂概念,类比农场与工厂的生产模式,作为规模化生产“高能量数据”的核心载体。数据工厂应具备集中/分布式形态,覆盖数据清洗、合成、增强、标注、质检等工艺,产出可直接用于垂直大模型对齐与推理的产品。其落地路径包括数据标注企业升级、算力中心向数据工厂转型、AI企业延伸至前端数据生产,以及创新型技术企业的崛起。最后,建议在国家或区域层面统筹部署数据工厂,与数据基础设施紧密衔接,在底层建设公共数据工厂、行业公共数据工厂,并在流通利用设施中布局专属数据工厂,形成体系化支撑。
🏷️ #数据工厂 #高质量数据集 #智能化应用 #数据要素 #产业链
🔗 原文链接