01期丨基因序列,了解新冠和战胜新冠的基石
作者:德同智汇 发布时间:2022-08-18

01


2019年12月,武汉市部分医疗机构陆续接诊不明原因的非典型性肺炎患者。

2020年1月,发现肺炎病例的病原体是新冠病毒(3. Novel Coronavirus (2019-nCoV) Situation Report 1, 21 January 2020 (World Health Organization, 2020).),并将其临时命名为 2019 新型冠状病毒(2019-nCoV)。

2020年2月,WHO世界卫生组织将2019年底出现的新型冠状病毒正式命名为“COVID-19”。其中,“CO”代表Corona(冠状),“VI”代表Virus(病毒),“D”代表Disease(疾病),“19”代表疾病发现的年份2019年。

由于该病毒与引发SARS的冠状病毒具有高度同缘性,该病毒的正式分类名为严重急性呼吸综合征冠状病毒2(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)。

从世界卫生组织官方网站上可以看到,在全球范围内,截至2021 年 8 月 17 日,WHO已经接到207,784,507例COVID-19确诊病例报告,包括4,370,424例死亡。这个数字是触目惊心的。新冠病毒表现出极强的致死性。

01期丨基因序列,了解新冠和战胜新冠的基石(图1)

图:2020年1月至撰稿日,全球COVID-19确诊人数

数据来自:WHO官方网站




02

研究表明,冠状病毒科基因组为一条单股正链RNA(①),长度为26-32kb(②)。由于其囊膜上的突出的刺突蛋白使得其整体呈现冠状,冠状病毒由此而得名。1960年,首次发现了可以感染人类的冠状病毒。

单链RNA病毒由于缺乏具有修正错误的聚合酶(③),不稳定,与一般生物相比,具有突变频率高且多方向的特点。当病毒在不同物种间传播时,通常会出现由于自然选择的压力而发生变异的情况。

新冠病毒爆发后,中国疾控中心、中国医学科学院、中国科学院病毒所、解放军医学科学院,四家单位背靠背独立地进行病原体分离,得到一致相同的结果,并于1月12号向世界卫生组织上传了新型冠状病毒的基因序列(④)

中国科学院武汉病毒研究所石正丽团队首先研究发现,新型冠状病毒与此前在云南中华菊头蝠上检测到的蝙蝠冠状病毒RaTG13相比,具有96.2%的一致性。值得注意的是,根据其此前研究,中华菊头蝠携带的SARS样冠状病毒与2003年爆发的SARS病毒具有高度同源性(⑤)

石正丽团队获得了一个29891bp的冠状病毒基因组,且与SARS-CoV BJ01 (GenBank登录号AY278488.2)的序列同源性为79.5%。

随后,使用NGS和PCR从其他4例患者中均获得了2019-nCoV全长基因组序列(WIV02、WIV05、WIV06和WIV07),它们之间的同源性在99.9%以上。2019-nCoV基因组由冠状病毒常见的6个主要开放阅读框(ORFs)(⑥)和一些其他辅助基因组成。

澳大利亚的George Taiaroa团队2020年4月份发布了第一份SARS-CoV-2天然RNA序列,并详细介绍了冠状病毒转录组(⑦)和表观转录组。同时,该文章还详细介绍了该冠状病毒亚基因组长度的mRNA(⑧)结构,并描述了从共享数据中揭示的冠状病毒进化遗传学的各个方面。相关文章发布于2020年4月3日的bioRxiv

该文章认为,冠状病毒的基因组在某种程度上来说是所有RNA病毒中最大的基因组,并以一套嵌套式的多腺苷酸化 mRNA形式表达它们的遗传内容。其长度与编码的开放阅读框(ORF)相当,包括两个大的ORF, ORF1a和ORF1ab,并在侵入细胞时,由完整的病毒基因组编码并表达。

其他的亚基因组mRNAs编码结构蛋白(刺突蛋白(S),包膜蛋白(E)、膜蛋白(M)、核衣壳蛋白(N)及附属蛋白蛋白质(3a, 6, 7a, 7b, 8和10)。亚基因组mRNAs有一个共同的5 '端前导序列,与位于病毒基因组5'-UTR的序列几乎相同。转录机制(⑨)使得ORFs上游的5 '端前导序列重新定位,每次翻译起始位点总是位于核糖体扫描的起始位置。

该文章还指出,SARS-CoV-2是一个单股正链RNA病毒,属于冠状病毒科和β冠状病毒属[5]。相关的乙型冠状病毒能够感染和在哺乳动物和禽类宿主中持续传播,导致人类疾病,例如中东呼吸综合征(MERS)及原发严重急性呼吸系统疾病综合征(SARS)等 [6-7]。

截止目前,在NCBI(美国国家生物信息中心)可以查询到新冠病毒RNA基因组全序列相关基因序列将近24万条,全球通过GISAID(全球共享流感数据倡议组织)上传共享新冠病毒数据达30多万条,这些基因序列的全球共享建立在世卫组织全球流感规划的合作精神之上。正是这些基因序列的共享,全球新冠病毒疫苗和诊断试剂才得以快速出现。




03

笔者以“COVID-19”、“SARS-CoV-2”、“2019-nCoV”、“RNA”为关键词在智慧芽进行搜索,发现福州大学在2020年1月15日就已经申请了名为“一种分子检测SARS-CoV-2冠状病毒的一步法试剂盒”的专利,并于2021年7月13日获得授权。

笔者共检索到新冠病毒试剂盒、治疗及疫苗相关专利共1555个,其中,与试剂盒相关的专利有272个,与检验方法有关的专利有69个,与抗体有关的专利有33条。

在专利申请区域上可以清楚看到,我国在全球新冠病毒防治上做出了极大的贡献的背后的技术原因。我国专利申请占到全球新冠病毒基因组相关专利申请的63.35%,位于首位,美国居于第二,申请量占9.46%。我国在新冠病毒的监测和诊断方面占据着绝对优势。

01期丨基因序列,了解新冠和战胜新冠的基石(图2)

图:全球各国新冠疫苗病毒基因组相关专利情况

此外,在专利申请内容上,与新冠病毒相关的“编码”、“腺病毒”、“表达载体”、“融合蛋白”、“载体疫苗”的专利居多。这些技术与疫苗、制药等研发息息相关,是新冠病毒的研究核心。

01期丨基因序列,了解新冠和战胜新冠的基石(图3)

图:新冠病毒相关专利申请关键点分布

在申请主体上,中国人民解放军军事科学院军事医学研究院占据着绝对的优势,排行第一。在前十位申请主体中,我国专利申请主体占9位之多。

01期丨基因序列,了解新冠和战胜新冠的基石(图4)

图:新冠病毒相关专利申请主体情况

基因序列作为了解新冠病毒的起步,也是攻破新冠病毒防治突围线的核心技术。解读基因序列以及更高效的解读方式必然是新冠病毒以及疫苗相关专利的重要组成部分。我国在此方面的研究如前文所述,已经处于全球的前列,但仍有需要需要攻坚之处。

从本期文章开始,德同智汇会从基因、蛋白质开始,带大家更完整地了解新冠病毒,再从疫苗、制药了解防治和战胜新冠病毒和疫情的道路上,深入试验和发展技术的重要性。

人们畏惧未知的事物,却可以战胜已知的恶魔。当我们充分了解新冠病毒和新冠疫苗后,我们便可以不再胆怯和畏惧,会有更多的勇气和底气去获得这一场全球疫情的胜利。









专有名词解释

①单股正链RNA一般来说生物学家根据RNA能否直接起mRNA作用而分成单股正链RNA病毒(正股RNA病毒)与单股负链RNA病毒(负股RNA病毒)两种。

正股RNA病毒(如脊髓灰质炎病毒)的单股RNA可直接起mRNA作用,转译早期蛋白质,包括RNA多聚酶和抑制宿主细胞合成代谢的调控蛋白。然后在RNA多聚酶的作用下,以单股RNA(正股)为模板,形成互补股(负股),两者结合成双股,称为复制型。再由负股产生出许多新的RNA(正股),成为复制中间体。此新的正股RNA可作为mRNA合成衣壳蛋白。

负股RNA病毒(如正粘病毒、副粘病毒、弹状病毒)的单股RNA不能作为mRNA,称为负股,须先合成互补股(正股)作为mRNA,再转译蛋白分子,而后产生核酸的复制型,成为合成子代病毒RNA的模板。

②kb:DNA的一个常用的长度单位,指某段DNA分子中含有一千个碱基对,英文全称为Kilobase(kb),即千碱基对。

③聚合酶:又称多聚酶。是专门生物催化合成脱氧核糖核酸(DNA)和核糖核酸(RNA)的一类酶的统称。1957年,美国科学家阿瑟·科恩伯格(Arthur Kornberg)发现。

④基因序列:使用一串字母表示的真实的或者假设的携带基因信息的DNA分子的一级结构。可能的字母只有A,C,G和T,分别代表组成DNA的四种核苷酸——腺嘌呤,胞嘧啶,鸟嘌呤,胸腺嘧啶。

⑤同源性:在分子进化研究中,同源性一般是指两种核酸分子的核苷酸序列之间或两种蛋白质分子的氨基酸序列之间的相似程度。序列分析是最终测定同源性程度的方法,DNA—DNA杂交或DNA—RNA杂交也是有用的估计途径。

⑥开放阅读框(ORFs):结构基因的正常核苷酸序列,从起始密码子到终止密码子的阅读框可编码完整的多肽链,其间不存在使翻译中断的终止密码子。

⑦转录组:广义上指某一生理条件下,细胞内所有转录产物的集合,包括信使RNA、核糖体RNA、转运RNA及非编码RNA;狭义上指所有mRNA的集合

⑧mRNA:一般指信使RNA,信使核糖核酸,是由DNA的一条链作为模板转录而来的、携带遗传信息能指导蛋白质合成的一类单链核糖核酸,

⑨转录机制:遗传信息从DNA流向RNA的过程,是蛋白质合成的第一步·。即以双链DNA中的确定的一条链(模板链用于转录,编码链不用于转录)为模板,以A,U,C,G四种核糖核苷酸为原料,在RNA聚合酶催化下合成RNA的过程。







参考文献

[1] Wickham H. ggplot2: elegant graphics for data analysis. Springer; 2016 Jun 8

[2] R Core Team (2018). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria.

[3] Sato, Kengo, et al. "IPknot: fast and accurate prediction of RNA secondary structures with pseudoknots using integer programming." Bioinformatics. 2011 27.13: i85-i93.

[4]文中图标数据来自WTO官网以及智慧芽数据库



上一条 下一条
x
资讯信息
您的姓名是?
您的手机号码是?
您的电子邮箱是?
您的微信号是?
咨询问题
您可以详述您的问题以便于我们专业顾问为您提供更全面的资讯