人工智能高速发展的当下,高质量数据是各行业与AI深度融合的关键支撑。5月20日,全国高质量数据集与数据标注产业供需对接活动在广东广州举行,打响了一场关于数据质量的“攻坚战”。

以赛促建:数据集征集旨在“掘金”
活动现场,广东省高质量数据集创新大赛(第二期)与广州市高质量数据集征集同步启动。
这不仅是简单的数据收集,更是一场针对数据资源的摸底。广州现场发布“英雄帖”——针对人工智能高质量数据集,政府将提供官方认证、政策激励、项目推荐等全链条支持。此举目的明确:把暂时蒙尘的优质数据资源,变成驱动产业发展的“真金白银”。
广州里工实业有限公司(下称“里工实业”)资深市场经理曹煜然深耕数据行业多年。此次活动中,里工实业携行业首创的一体化数据采集套件亮相,通过将原本百万元级数据采集成本降至五六万元,以低成本破解数据短缺难题。作为数据供给方,曹煜然本次来到活动现场正是为了寻求更多机会,与行业共建高质量数据底座。
多方共建:AI数据有了“中央厨房”
有了高质量数据,行业还需专业加工基地赋能。活动现场,广州人工智能数据训练中心、东莞市数据标注产业园共同发布建设成果。
即日起启用的广州人工智能数据训练中心将聚焦自动驾驶、生物医药、具身智能、内容审核等赛道,提供从清洗、标注到训练的一站式服务,力争三年内营收突破五亿元,培训人工智能训练师超3000人。
经过半年发展的东莞市数据标注产业园则已吸引超35家企业签约,引进专业化人才超过400名,构建起“标注+模型+测评+应用”的发展生态。当前,产业园实现智能自动标注率达70%以上,标注效率对比纯人工标注提升300%,各项指标位居行业的第一梯队。
搭建平台:让数据流通有利可图
有了数据后,如何让其成为产品走向市场?广州在活动现场提供了一套城市可信数据空间激励机制,通过“让利赋能”,打通数据变现通道。
广州城市可信数据空间为数据产品提供“零成本”获客渠道,针对成熟的自研产品,空间通过主页推荐、视频宣传、路演等形式进行推广。在参与运营服务的情况下,专区运营方可获得大部分收益,且分润比例随交易规模提升。此外,该空间每年还将对年度最强“小生态”、年度应用场景、年度“爆款”等予以奖励。
广州市政务和数据局负责人表示,这套城市可信数据空间激励机制旨在打破“数据孤岛”,构建经济自循环系统,让市场主体从“敢共享”变为“想共享”。

落地赋能:把数据转化为生产力
所有的布局,最终都指向产业落地。本次全国高质量数据集与数据标注产业供需对接活动是全国数据标准化技术委员会2026年第一次“标准周”系列活动之一。
据悉,2026年第一次“标准周”活动由国家数据局指导,全国数据标准化技术委员会主办,全国数据标准化技术委员会秘书处(中国电子技术标准化研究院)、广东省政务服务和数据管理局、广州市人民政府承办。活动为期五天,其间将召开系列工作组会及研讨会。
广东将以此为契机,加快建设国家数字经济创新发展试验区,持续深化数据要素市场化配置改革,推动数据资源开发利用,聚焦高质量数据集建设和数据标注产业发展,强化数据供给创新应用、供需对接桥梁搭建、人才队伍建设,持续优化数据产业发展环境。
数据,正从冰冷的数字,转化为实实在在的生产力。

