澎湃新闻记者 贺梨萍
国家基因组科学数据中心(NGDC)信息显示,1月26日,该中心收录了由中国医学科学院/北京协和医学院病原生物学研究所提供的5株2019新型冠状病毒全基因组序列。
这是自2019年12月该病爆发以来,国内公共数据平台首次公开发布数据。此前科学家陆续获得的2019新型冠状病毒基因组序列一般递交到全球流感序列数据库(GISAID)和美国国家生物技术信息中心(NCBI)的GenBank数据库。
此前的1月22日,国家基因组科学数据中心正式发布2019新型冠状病毒信息库。该库整合了世界卫生组织(WHO)、中国疾病预防控制中心(CDC)、美国国家生物技术信息中心、全球流感序列数据库等机构公开发布的冠状病毒基因组序列数据、元信息、学术文献、新闻动态、科普文章。同时,对不同冠状病毒株的基因组序列做了变异分析与展示。
2019新型冠状病毒信息库基于不同参考基因组序列开展2019-nCoV病毒株基因组变异分析,并对结果进行了统计与可视化展示。通过对全基因组序列相似性比较和变异位点分析,获取2019-nCoV病毒株之间、2019-nCoV病毒株与SARS冠状病毒以及与类SARS冠状病毒蝙蝠株之间的变异程度、变异区域、变异碱基的详细信息。
对2019-nCoV病毒株的基因组变异分析为追溯病毒来源、追踪病毒株变异路径、防控新型冠状病毒引发的疫情、治疗病毒性肺炎提供重要的数据基础与决策支持。
上述资源库发布之际,中科院北京基因组所研究员、国家基因组科学数据中心主任鲍一明在接受《中国科学报》采访时曾表示,“我们这个数据库发布以后,就有单位联系要将武汉新型冠状病毒基因组的数据送到这儿来,而不是先到国外然后国内研究人员再去拿回来‘出口转内销’了。”
国家基因组科学数据中心介绍,冠状病毒属于套式病毒目、冠状病毒科、冠状病毒属,是一类具有囊膜、基因组为线性单股正链的RNA病毒,是自然界广泛存在的一大类病毒。某些冠状病毒会感染人类并引起疾病,比如中东呼吸综合征(MERS)和严重急性呼吸综合征(SARS),其症状可从普通感冒到重症肺部感染。
此次在武汉首先发现的冠状病毒是一种先前尚未在人类中发现的病毒株系,被WHO命名为2019新型冠状病毒(2019-nCoV)。NCBI的病毒分类工具PASC将2019-nCov分类为严重急性呼吸综合征相关冠状病毒种(Severe acute respiratory syndrome-related coronavirus),该种还包含2003年爆发的SARS病毒,两者基因组序列相似度为80%。
此次发布的5株2019新型冠状病毒基因组序列的序列号为GWHABKF00000000、GWHABKG00000000、GWHABKH00000000、GWHABKI00000000、GWHABKJ00000000,相关项目编号为PRJCA002165。
以上序列可在国家生物信息中心/国家基因组科学数据中心的项目库或者冠状病毒序列库检索并下载,无需注册或向数据递交者申请。