📰 深耕高质量数据集建设 激活人工智能发展新动能_数字快讯_数字中国建设峰会

当前,人工智能正处于规模化落地应用的关键阶段,高质量数据集被视为驱动大模型开发与训练的“燃料”,其供给规模、质量与流通效率直接影响落地深度与广度。为推动行业高质量数据集供给,国家数据局发布实施方案,围绕供给、流通、应用等环节,提出六大专项行动,系统回应“建”到“用”的堵点,对培育新质生产力、形成新优势具有重大意义。方案强调聚焦重点领域,提升体系化供给能力,解决数据规模不足、结构失衡等问题,推动产业链协同共建,建立数据资源与需求清单,让应用有数可用。北京在此方面已初步成效显著,目标在两年内新增高质量数据100PB,并推动高质量数据集在具身智能、科学智能等领域的应用落地。方案另提出推动数据标注产业转型、强化专业人才支撑,通过人机协同标注、专家型服务与创新试验区建设,提升知识密度与标注效率。基础设施方面强调数据流通、可信数据空间与应用中试基地建设,以释放数据要素价值。未来需从体系化供给、差异化标注、创新商业模式三方面发力,形成以数据为核心的产业生态,探索以词元为单位的计价与结算模式,推动“为高质量数据付费”的市场共识。

🏷️ #数据集 #标注 #数据流通 #北京 #行业应用

🔗 原文链接
 
 
Back to Top