AI训练数据成热门 全国首单成交南京完成
在江苏省南京市玄武区的江苏箸境智能科技有限公司实验室里,工作人员正在进行一项特殊的工作:他们通过轻柔的手势动作,向机器人传授基础技能。每一个细微的动作都被实时转化为结构化的数据,这些数据包含了视频、关节角度与力矩参数,就像是为机器注入了"肌肉记忆"。
最近,在江苏省数据交易所完成的具身智能数据集交易,标志着全国范围内首个此类数据交易的诞生。这一突破不仅体现了人工智能产业正在经历从"模型驱动"向"数据驱动"的重大转变,也展现了江苏在数据要素市场化方面的创新步伐。
这场数据交易的背后,引发了关于高质量数据的重要思考:什么样的数据才能真正推动AI的发展?哪些数据能够创造价值并获得市场认可?这些问题正在成为人工智能与实体经济深度融合的关键。

成立于几个月前的江苏箸境智能科技有限公司,目前正处于高速发展的阶段。在实验室里,一台机器人正在进行家政技能训练:它反复尝试用机械手抓取水瓶、叠放毛巾和擦拭桌面。这些看似简单的任务,实际上需要大量高质量数据来支撑。
"就像教小孩子学习写字一样,机器人的动作也需要我们手把手地指导。"技术人员王煊解释道。每一次机器人完成一个任务,都会生成新的数据记录。这些数据不仅包含了机器人执行任务时的视觉信息和机械动作参数,还包括了具体的操作指令。
此次交易的数据集包含约2.5万条结构化数据,覆盖办公、商超、餐饮和家政四大场景。每一条数据都经过严格的筛选和标注,为AI模型的训练提供了高质量的基础素材。
"我们提供的不仅是未经处理的原始数据,而是经过深度清洗和精心标注的'高浓度养分'。"王煊表示,这种标准化的数据产品能够帮助用户快速搭建AI模型,而无需从零开始建立数据采集环境,这大大降低了研发成本。
在江苏,高质量数据产品的价值已经得到广泛认可。作为国内数据要素资源大省,江苏早在2023年就启动了专项行动,通过完善数据供需机制、推动标注产业发展和搭建公共服务平台等措施,逐步构建起完整的数据要素市场。

南京市玄武区作为江苏省软件产业的核心区域,正在全力构建数据要素产业生态。截至目前,江苏已在医疗、交通、工业和文旅等多个领域形成超过93PB的高质量数据集。
面向未来,如何建设更高效的高质量数据集?标准化被普遍认为是关键路径。今年7月成立的江苏传古科技有限公司,在数交所上线了一款儿童肠道菌群数据集,并完成了首次交易。这些看似普通的微生物数据,实际上蕴含着巨大的跨界应用价值。
今年11月,全国数据标准化技术委员会在南京召开了"标准周"活动。专家们指出,标准化是连接数据资源与实际应用的重要桥梁。目前,已发布的4项高质量数据集技术文件正在推动行业走向规范。
国家层面的顶层设计也在加速推进。按照"1+3+5+N"的发展思路,我国将从基础设施建设、多元主体参与和典型场景应用等多个维度,全面推进高质量数据集的建设与发展。

由南京市和玄武区政府共同主办的"数智未来"高质量数据集开发者创新大赛即将启动。这次比赛将围绕医疗健康、卫星遥感等五大专业领域,旨在通过赛事推动数据应用落地,并促进相关产业生态的发展。
从首笔具身智能数据交易的成功实施,到标准化体系的逐步完善,江苏正在探索一条高效释放数据价值的新路径。当机器人开始学会"叠毛巾"和"抓水瓶",当高质量数据成为AI走向现实世界的"桥梁",一场由数据驱动的智能革命,正悄然改变着我们的生活。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。



