国家标准计划《信息技术 生物特征识别 高通量测序基因分型数据注释格式》由 TC28(全国信息技术标准化技术委员会)归口,TC28SC37(全国信息技术标准化技术委员会生物特征识别分会)执行 ,主管部门为国家标准委。
主要起草单位 山西医科大学 、中国电子技术标准化研究院 、深圳华大法医科技有限公司 、上海国际人类表型组研究院 、西安交通大学 、华南理工大学 、中国刑警学院 、最高人民检察院 、四川大学 、广东省公安厅 、微基因科技有限公司 、安徽芜湖公安局 、烟台大学 。
| 35 信息技术、办公机械 |
| 35.240 信息技术应用 |
| 35.240.15 识别卡和有关装置 |
高通量测序技术具有高通量、集成化、低成本等显著优势,可提高多领域DNA检验能力。
该技术可实现同时测定STR、SNP、线粒体DNA等多类遗传标记,并大幅提升检测基因座的数量。
随着该技术的快速发展,在科学研究、病原微生物检测、基因诊断、法庭科学等领域展开广泛应用,由此产生海量DNA分型数据。
由于在不同领域分型数据格式不统一,甚至在同一领域(如消费基因检测),仍存在分型数据格式五花八门、数据质量良莠不齐、部分关键信息缺失等问题,导致即使是同一个样本的检测数据无法在不同的实验室或不同检测平台之间共享和交流,形成数据壁垒。
目前已有一系列高通量测序技术相关的国家标准制定,主要围绕测序方法、测序数据质量控制、数据安全与存储等方面,而针对高通量测序分型数据的注释规范尚处于空白。
因此,有必要制定具有前瞻性、科学性、实用性的高通量测序分型数据注释规范,以便于数据交换比对、消除数据壁垒,对落实大数据国家战略具有重要意义。
本文件规定了高通量测序技术产生的基因组序列数据相关基因分型数据的注释格式。 本文件适用于基于高通量测序的生物特征识别基因座分型数据的注释格式,用于基因组测序产生的基因分型数据的存储、交换和比对等。 主要技术内容:1)SNP注释规范;2)InDel注释规范;3)线粒体DNA多态性注释规范;4)STR注释规范;5)微单倍型注释规范。