新一代高水平數據標注在推動數據資源匯聚、提升數據質量、激活數據要素價值方面發(fā)揮著日益重要的作用,是支撐人工智能技術演進和應用落地的重要抓手。2024年12月,國家發(fā)展改革委、國家數據局等部門印發(fā)《關于促進數據標注產業(yè)高質量發(fā)展的實施意見》(發(fā)改數據[2024]1822號),引領數據標注行業(yè)發(fā)展,對數據標注產業(yè)高質量發(fā)展具有重要的意義。
中國信息通信研究院(簡稱“中國信通院”)緊緊抓住數據標注這個小切口,以服務國家戰(zhàn)略大視野,制定《面向人工智能的數據生產和標注服務能力通用成熟度模型》行業(yè)標準文稿(2021-1306T-YD),并于日前正式報批,著力推動數據標注產業(yè)高質量發(fā)展和人工智能快速應用落地。數據生產標注服務主要指對人工智能數據集和相關服務進行交付和實施的過程,該標準旨在面向人工智能數據供應方提供數據標注服務能力的評價與指導,也可作為人工智能數據需求方衡量供應方數據標注服務能力水平的標準依據,主要包括技術服務、標準規(guī)范、人員管理、項目管理、運營維護、生態(tài)培育、安全保障7個方面,包括23個能力項,200余項能力要求。

《面向人工智能的數據生產和標注服務能力通用成熟度模型》
本標準面向數據標注能力提供方,提供技術迭代和產品更新指引;面向數據標注能力需求方,提供供應商選擇和管理的參考。本標準的發(fā)布將解決數據標注行業(yè)缺乏標準指引和規(guī)范的現狀,有助于顯著提升數據標注行業(yè)能力水平,有效帶動數據標注產業(yè)健康、可持續(xù)發(fā)展。
中國信通院支撐國家數據局開展數據標注典型案例征集,服務地方數據標注基地建設,推動人工智能數據處理和質量測評中心落地區(qū)域,組織開展數據標注供需對接會,成立AIIA數據標注分委會聯合生態(tài)開展數據標注共建計劃。下一步依托數據標注相關標準,將繼續(xù)支撐國家數據局數據標注相關頂層設計和政策研究,促進數據要素價值釋放和人工智能場景應用和落地。