注册

国家标准计划《科学数据收割规范》由 TC486(全国科技平台标准化技术委员会)归口 ,主管部门为科技部

主要起草单位 中国科学院计算机网络信息中心

目录

基础信息

计划号
20221226-T-306
制修订
制定
项目周期
22个月
下达日期
2022-12-13
申报日期
2021-09-30
公示开始日期
2022-07-14
公示截止日期
2022-07-28
标准类别
方法
国际标准分类号
35.100.70
35 信息技术、办公机械
35.100 开放系统互连(OSI)
35.100.70 应用层
归口单位
全国科技平台标准化技术委员会
执行单位
全国科技平台标准化技术委员会
主管部门
科技部

起草单位

目的意义

2018年3月,《国家科学数据管理办法》发布,明确要求科学数据集中管理,科学数据中心“承担相关领域科学数据的整合汇交工作”,科学数据“有关目录和数据应及时接入国家数据共享交换平台”。

目前,以OAI-PMH为代表的元数据收割协议在数据采集、共享方面已得到了广泛的应用;在以野外台站为代表的的领域分布式科研网络中,数据收割的方式也被普遍采用;近年来,随着互联网的发展,各类数据的自动化爬取已成为数据获取的重要方式。

但在科学数据管理和共享服务方面,尚未建立起主动式获取的常态化、通用性机制和规范。

随着多学科科学数据汇交需求日益迫切,数据驱动科研创新对科学数据实时性、时效性的要求也日益提高,面向异种异质异构科学数据的、统一的收割规范的建立迫在眉睫。

本项目建立的目的是对我国科研项目全生命周期内数据管理的数据汇聚过程进行指导,面向数据获取与处置标准大类,资源获取标准小类中科学数据收割进行规范,确保以收割方式获取的科学数据格式规范、内容完整、具有可重用性和可互操作性。

范围和主要技术内容

科学数据收割规范覆盖科学数据收割过程的关键要素,并进行规范化指导。规范适用于各类科学数据采集机构、科学数据管理机构和科学数据服务机构等。主要内容覆盖科学数据收割的主体、对象、必备性参考、描述和规范说明,以及科学数据收割定量要素的语义和语法规则等。