注册

国家标准计划《健康信息学 基因序列变异置标语言 (GSVML)》由 424-cnis(中国标准化研究院)归口 ,主管部门为国家市场监督管理总局

主要起草单位 中国标准化研究院杭州恒生芸泰网络科技有限公司中国标准科技集团有限公司浙江数字医疗卫生技术研究院成都市标准化研究院四川科伦医药贸易有限公司北医三院中日友好医院等

目录

基础信息

计划号
20162579-T-424
制修订
制定
项目周期
24个月
下达日期
2016-12-28
申报日期
2016-05-03
公示开始日期
2016-10-14
公示截止日期
2016-10-30
标准类别
基础
国际标准分类号
35.240.80
35 信息技术、办公机械
35.240 信息技术应用
35.240.80 信息技术在医药卫生技术中的应用
归口单位
中国标准化研究院
执行单位
中国标准化研究院
主管部门
国家市场监督管理总局

起草单位

采标情况

本标准修改采用ISO国际标准:ISO 25720:2009。

采标中文名称:健康信息学 基因序列变异置标语言 (GSVML)。

目的意义

在当前的电子世界中,在医疗保健方面有多种不同类型的数据。

除了临床数据和影像数据之外,我们已进入后基因组时代,正在创建国际性的、大量的基因组数据。

国际标准开发机构正在开发这些数据:HL7已为临床开发了标准,DICOM和JPEG开发了影像数据。

基因组序列变异标记语言(GSVML)为基因组数据确定了一个标准,特别是与人相关的DNA变异数据。

GSVML的核心目标是单核苷酸多态性(SNP)。

在后基因组时代里,对基因组研究和基于基因组的医学在处理健康相关的数据变得越来越重要。

对处理临床、影像、基因数据的方法已开始成为基本的、高水准的研究。

现在全世界有多种组学数据期待为人类医学效力。

为达到此目的必须克服障碍支持数据格式和信息标准的开发以支持组学数据的交换。

基因组数据包括基因组序列、DNA序列变异、和其他基于基因组的数据如表达数据、蛋白组学数据、分子网络等。

作为入口点,这一标准聚焦于DNA序列变异。

在DNA序列变异之中SNP选为核心目标,根据以下3个理由: a)为人类健康,SNP是研究得最多的序列。

b)当前的环境中,全世界有数量庞大的SNP数据,存在于不同类型的数据格式中。

由于近来爆炸性的SNP研究,数量庞大的实验数据以各种类型的数据格式聚积在许多数据库中。

这些数据期待着使用于药物发现,临床诊断和临床研究。

c)SNP数据为人类应用已产生巨大影响如基于基因的医学和药物基因组学。

鉴于这一背景,国际社团需要一种相互操作格式来交换SNP数据。

我们阐明了具有不同型式数据的人类健康有关机构交换数据的必要性。

范围和主要技术内容

本标准可作为数据交换格式,便于在世界范围内交换基因组序列变异数据,没有强制改变任何数据库模式。从信息学角度,GSVML确定的数据交换格式基于XML。此国际标准范畴就是数据交换格式,但数据库本身是在国际标准范畴之外的。从生物学观点看,所有基因序列变异都应加考虑,都在国际标准范畴之内,多态性、特别是SNPs是国际标准的主要聚焦点。换言之,变异的注释凡与临床和组学有关的都在此国际标准范畴内。虽然,SNPs存在于生物界各个物种中,但此国际标准范畴仅覆盖人类健康关注的种类如人类、细胞系和临床前试验动物。其他生物界各个物种屏除在国际标准范畴之外。临床领域在国际标准范畴之内,但基础研究领域和其他科学领域在国际标准范畴之外。此处,临床研究,包括药物发现在国际标准范畴之内。就设想的应用领域而言,主要聚焦于人类健康,包括临床实践、预防医学、转化研究和临床研究。