📰 高质量数据集典型案例 | 视联网多行业空间治理数据集

为提升自研和生态合作的算法服务质量,中国铁塔股份有限公司汇聚超过800TB多模态样本数据,研发AI数据处理工具链,建设视联网空间治理数据集,涵盖应急、交通、环保等500多个高质量数据集。这些数据集支撑经纬大模型和400多种小模型算法,推动视联网重点行业的高质量发展。

依托工具链与系统,快速构建高质量数据集,样本库系统自动汇聚多源样本数据,提升样本数据治理水平。构建的多行业数据集用于算法训练与测评,交通、应急等行业的多模态数据集支撑经纬大模型研发,检测精准率超过90%。

通过智能工具链,研发多层次数据分类模型,形成超过31亿有效标签,分类效率提高95%。跨模态对齐挖掘样本数据价值,建立图像、视频等多维度数据对齐关系,促进数据集的全生命周期管理,维护数据集版本,实现有效复用,拉动视联网业务收入增长。

🏷️ #视联网 #数据治理 #AI算法 #多模态数据 #生态合作

🔗 原文链接
 
 
Back to Top