注册

国家标准计划《时空组学 数据集格式规范》由 TC387(全国生化检测标准化技术委员会)归口 ,主管部门为国家标准委

主要起草单位 深圳华大生命科学研究院中国测试技术研究院中国科学院脑科学与智能技术卓越创新中心中国科学院大学上海瑞金医院诺禾致源鹏城国家实验室等

目录

基础信息

计划号
20240066-T-469
制修订
制定
项目周期
18个月
下达日期
2024-03-25
申报日期
2023-10-23
公示开始日期
2024-01-22
公示截止日期
2024-02-21
标准类别
基础
国际标准分类号
07.080
07 数学、自然科学
07.080 生物学、植物学、动物学
归口单位
全国生化检测标准化技术委员会
执行单位
全国生化检测标准化技术委员会
主管部门
国家标准委

起草单位

目的意义

立项必要性: 自参加人类基因组计划开始,在生命科技研究及产业化领域我国一开始就和国际处于同一起跑线上;而随着二十多年的高速发展,在时空组学领域,已经有多个我国自主研发的技术平台,已处于世界领先水平。

时空组学技术能同时实现“亚细胞级分辨率”和“厘米级全景视场”的技术,并可以实现基因与影像同时分析,相较于传统的组学研究更具有应用前景和价值。

并且在产业链上也完成了全面自主研发的布局,由技术发展形成了从上游试剂及设备到下游应用均领先世界。

随着大视场和高分辨的时空组学的广泛应用,同时也带来了数据量庞大、精确度要求高的挑战,而数据格式的各异已成为技术扩大应用及时空组学数据有效积累的主要限制,因此急需数据标准上的规范和引领。

有别于高通量测序技术,时空组学技术包括将切片中的核酸等生物分子按照其空间位置捕获,并加上空间位置对应的序列条形码,通过高通量测序和相应算法重建出特定生物分子空间分布信息的全流程,有着独特的数据处理方法。

由此衍生的时空组学试剂套装产品、时空芯片、时空组学技术服务等正在快速发展,以华大时空、百迈客、万乘基因、德运康瑞等企业为代表,都在布局时空组学的产业及科研的“一站式”服务。

数据标准的统一,将为生物技术和产业的发展提供有力的底层支撑。

此外,为推动时空组学在生命科学各个领域的广泛应用,深圳华大生命科学研究院等机构从2021年开始筹办发起时空组学国际联盟(STOC),由来自哈佛大学、剑桥大学、牛津大学等16个国家的80多位科学家组成,并于2022年5月时空组学联盟正式启动。

通过时空组学联盟的建立,联合各领域专家共同努力,推动时空多组学新技术及关键领先技术的不断发展和应用。

目前国内外均无统一数据存储和交付相关的标准。

时空组学测序技术的提供方主要有10X Genomics的Visium和Xenium技术、NanoString的CosMX SMI技术;我国自主研发的Stereo-seq技术,百创S1000芯片技术,同时也有很多新型时空组学技术涌现,但并无统一的标准,不同平台的数据不能互交使用,不利于数据的存储汇集、共享和交换。

建立时空组学数据集格式规范,可用于指导使用时空组学技术的研发企业和中下游产业应用,为技术和产业应用等领域打下数据基础。

同时有助于时空组学数据积累、归档和共享的有标可依,促进高质量数据的管理和交换共享,促进生物产业发展。

项目可行性: 目前时空组学数据在国际标准和国家标准上都还存在空白,项目提出单位深圳华大生命科学研究院已通过前期调研,并根据市场和行业需求,联合多家科研及产业机构,完成了一项团体标准T/LTIA 18—2022《时空组学 时空转录组样本制备操作规范》,对时空组学的样本制备给出了规范,对于数据的产出已有一定的标准化基础。

该标准提案的主要内容数据格式及数据集等由牵头单位研发并经由多家单位使用优化,最终形成了目前的共识版本,并有着良好的应用基础。

因此,时空组学数据标准的提出具有一定的工作基础。

范围和主要技术内容

本文件规定了时空组学数据集的存储及格式要求,包括时空组学的元数据、时空组学数据文件及数据存储目录。 本文件适用于时空组学数据,特别是空间转录组学数据的交换与共享。 主要技术内容: 1. 时空组学元数据要求 2. 时空组学数据集文件要求 3. 时空组学数据存储目录要求