📰 我国已建设高质量数据集超3.5万个 总量超400PB_行业资讯_数字中国建设峰会

在2025中国国际大数据产业博览会上,《高质量数据集建设指引》正式发布,标志着我国在高质量数据集建设方面取得了显著进展。截至2025年6月,全国已建设高质量数据集超3.5万个,总量超过400PB。随着人工智能技术的发展,高质量数据的作用愈发重要,成为大模型训练的核心资源,推动了“人工智能+”场景的落地。

《建设指引》明确了高质量数据集作为人工智能与实体经济融合的核心载体,同时也指出我国在数据开放度、标准体系等方面仍存在短板。国家数据局和各方主体正在协同共建行业生态,推动数据标注行业的发展,并已建设524个高质量数据集,赋能多个国产人工智能大模型。

为促进高质量数据集的可持续发展,《建设指引》提出了体系化思维和生态化环境的构建方案,强调要通过“平台+数据集+模型”的一体化服务设施,降低数据集应用门槛,推动市场化流通。通过制度创新和人才培养,形成多方共赢的生态体系,解决建设成本高、共享意愿低等问题。

🏷️ #高质量数据集 #人工智能 #政策指引 #数据生态 #市场化流通

🔗 原文链接
 
 
Back to Top