(原标题:乘“云”而上 加“数”奔跑——保定积极推动国家数据标注基地试点建设)
流淌千年时光的古城保定,站稳时代风口,全面激活数据要素,凝心聚力打造强基、兴业、善政、惠民的数字保定,发展路径清晰而笃定。
数据标注产业作为大数据产业、新一代人工智能产业的前置产业,对于激活数据价值、发展新质生产力有着重要的支撑作用。今年5月24日,国家数据局在第七届数字中国建设峰会上公布了首批7家全国数据标注试点基地名单,保定成为河北唯一入选城市。
何为数据标注?保定市数据局相关处室负责人解释说,数据标注是指通过加工处理,将图片、文本、语音、视频等原始数据转变为机器可识别信息的过程。数据是数字经济时代的关键要素,数据标注是人工智能算法运行的关键环节,在推动数据资源汇聚、提升数据质量、盘活数据要素价值中起着重要作用。
当前,保定市把发展数据服务产业作为推动数字保定发展的重要抓手,以打造“数据资源的聚集港口,数据资产的流通枢纽,数据价值的创新中心”为总目标,围绕数据产业链上下游,已吸引科大讯飞、百度、浪潮、小米等互联网头部企业来保发展,数据湾、深圳湾、深圳园、数字大厦等数据服务产业基地建设初具规模,初步形成了数据服务产业发展生态,为建设全国数据标注基地奠定了基础。
磁力剧场廊架、全息投影灯、数控流水装置……走进莲池区数据湾,一个个颇具科幻色彩、时尚气息的景观造型令人目不暇接;街道两侧高楼林立,科大讯飞、小米、浪潮云计算、天翼云等行业尖峰云集于此,已形成数据标注产业集聚。
作为莲池区重点打造的数字产业集聚区,数据湾位于保定城区东部,毗邻风光秀丽的东湖,占地面积达1161亩,是数据与科技的汇聚之地、创新发展的“未来之湾”。
5月17日,保定高新科创园内,国内信息及数据领域高端人才汇聚,2024数据价值化产业创新发展大会搭平台,嘉宾深入研讨数据要素发展新方向、新路径、新模式。通过“一库一平台三中心”,筑牢数据要素流通的基础支撑,促进数据流通交易。
建设千亩数据湾小镇,与中国电子商会共同打造北方数据服务产业基地,聚集数据服务企业500余家。建设市级公共数据基础资源库,支持企业构建自有版权的成品数据集,仅数云堂一家就形成了2PB的人工智能训练数据、4500余套数据产品,内容涵盖生物识别、自动驾驶等多个领域。同时,长城汽车自动驾驶等人工智能场景都为保定市数据标注产业发展提供了广阔的创新发展空间。
“数字保定”生动画卷渐铺展,风劲潮涌再扬帆。2023年,保定市落地数据服务企业达到500余家,从业人员超3万人,产值约为27亿元。其中,从事数据标注业务企业50余家,涵盖智能驾驶、智能座舱、智慧教育、新零售、语言大模型智能问答等业务领域。
按照计划,在2年试点建设期内,保定将大力发展数据标注产业,形成“数据+算力+算法+场景”于一体的大数据与人工智能产业生态体系,打造“京保雄张”数据产业创新发展廊道;同时,围绕智能网联汽车、新能源电力装备等重点行业,完成标注数据量总规模达到1000TB,引进5家数据标注龙头企业,培育30家本土数据标注企业,带动上万名数据标注从业人员就业,直接拉动数据标注产业规模达10亿元。
“下一步,我们将借鉴全国数据标注产业发达地区的相关政策,在企业孵化培育、重点项目落地实施、资金政策扶持等方面加大力度。”保定市数据局负责同志说,将依托长城汽车、数联天下等龙头企业建设行业高质量数据集,探索构建汽车、土地、医疗等行业垂直大模型;不定期组织数智场景交流活动,基于场景建设吸引数智化领域先进企业来保入驻,推动我市数字产业高质量发展。