中国人工智能发展获助力:公共数据可用于标注 | 南华早报
Mia Nulimaimaiti
中国首次发布方案允许公共数据标注使用,旨在增强快速发展的数字经济实力,并在国际竞争加剧背景下促进人工智能发展。
根据四部委周一联合发布的13点通知,我国将推进公共数据系统化标注利用,同时满足农业、制造业、信息技术等重点领域的数据需求。
通知指出:"(政府应)支持公共数据跨部门、跨地区、跨层级使用;鼓励政企合作开展面向政务领域的大模型数据标注训练;推动将数据标注服务纳入政府采购"。该文件由国家发改委、国家统计局、财政部及人社部联合印发。
通知强调,公共数据标注工作应当依法有序开展。
数据标注——即对文本、音频、图像、视频等不同数据类型进行分类标记的过程——通常被视为确保AI系统产出准确可靠结果的基础。高质量数据短缺一直是开发大语言模型面临的挑战之一。
2023年,数据标注行业估值达到800亿元人民币(约合109.1亿美元),该技术广泛应用于推动自动驾驶、低空经济、智能制造和智能医疗等前沿领域发展。
根据指导意见,中国承诺到2027年将数据标注产业的复合年增长率提升至20%。