发布时间:2021-05-17所属分类:免费文献浏览:1次
摘 要: 中国病原生物学杂志
《乙型肝炎病毒密码子偏好性及影响因素分析》论文发表期刊:《中国病原生物学杂志》;发表周期:2020年12期
《乙型肝炎病毒密码子偏好性及影响因素分析》论文作者信息:吴炜倩(1998-),女,重庆忠县人,在读本科生。
【摘要】目的 分析乙型肝炎病毒(HBV)B、C基因型密码子使用偏好性及其影响因素,探讨HBV密码子使用模式与宿主、病毒进化的关系。方法 从GenBank数据库中收集47株HBV的全基因组序列,利用EMBOSS,SPSS24.0MEGAX等软件对其密码子偏好性进行统计分析。结果 HBV各蛋白编码序列的ENC值为56.37-58.74,CAI值为0.678-0.697,GC3含量为0.474-0.506,RSCU>1的密码子共27个,主要以U/C结尾。高频使用密码子为UCU、CCU和AGC,低频使用密码子为CUA,CCG,CGA,ACG和UCG,ENC绘图显示47株病毒均位于预期曲线之下。中性绘图分析表明GC12与GC3无显著相关性(R2=0.005,P<0.01),PR2绘图显示第三位碱基T和C含量较高。对应分析显示这些病毒的密码子偏好性受碱基组成影响的可能性较小。利用CAI值和卡方检验的方法确定GAC和GAA为上述毒株的最优密码子。密码子使用频率比值表明B,C基因型与人类的密码子偏好性相近,而聚合酶(P),表面(S)基因与人类的密码子偏好性存在一定的差异,以P基因差异更大。系统发生分析显示,HBV毒株分类的进化越相近,其密码子偏好性越相似。结论 B.C基因型HBV偏爱使用U/C结尾的密码子,其密码子偏好性主要受到自然选择的影响。结合密码子偏好性与密码子优化可能有助于理解HBV进化过程和对最适宿主的选择机制。
【关键词】乙型肝炎病毒;密码子使用偏好性;进化
Abstract Objective To analyze the codon usage bias of the B and C genotypes of the hepatitis B virus (HBV) and factors influencing it and to further explore its relationship to the evolution of HBV. Methods Forty-seven fulllength genomes of HBV were obtained from GenBank, and the codon usage bias and factors influencing it were evaluated using the relative synonymous codon usage (RSCU), codon adaptation index (CAI), effective number of codons (ENC), and GC calculated using EMBOSS and CodonW. SPSS24. 0 and MEGAX were used for statistical and phylogenetic analysis respectively. The best codon was determined using a y test (Chi-square test) based on the CAI. Results For the cod ing sequence of HBV, ENC ranged from 56. 37 to 58. 74, CAl ranged from 0. 678 to 0. 697, and GC3 content ranged from 0. 474 to 0. 506. Twenty-seven codons of HBV with a RSCU value larger than one mainly ended with U/C. The highrequency codons were UCU, CCU, and AGC while the low-frequency codons were CUA, CCG, CGA, ACG, and UCG. ENC plots indicated that all 47 isolates were below the expected curve. A neutrality plot analysis revealed no significant correlation between GC12 and GC3 (R2=0.005, P<0. 01). A PR2 bias-plot analysis revealed a high T and C content. Correspondence analysis suggested that overall nucleotide composition slightly affected the codon usage bias within the B and C genotypes of HBV in the current dataset. GAC and GAA were the optimal codons of the above strains based on the CAI value and a chi-square test. A comparative analysis of the relative frequency of codon usage revealed a high frequency of codon usage (84. 75%) in HBV genotypes B and C similar to the codon preference in human beings. This was true for the whole genome. The P gene of HBV genotypes B and C displayed the greatest dissimilarity (40.
68%), followed by the S gene (28.81%), Phylogenetic analysis indicated that HBV isolates with a similar codon preference were clustered closer together on the phylogenetic tree. Conclusion The HBV genotypes B and C examined in this study tend to have a codon ending with U or C. The codon preference is mainly affected by natural selection rather than base composition. The combination of codon preference and codon optimization may help to understand the evolutionary process of HBV and the mechanism by which it selects its
[Key words] Hepatitis B virus; codon usage bias; evolution
乙型肝炎病毒(hepatitis B virus,HBV)感染严重威胁人类健康。世界卫生组织报道全球约20亿人曾感染过HBV,其中约有2.4亿慢性HBV携带者。
HBV感染会诱发肝炎、肝硬化和肝癌,是世界范围内严重的公共卫生问题[-2),HBV隶属于嗜肝DNA病毒科的正肝病毒属。HBV基因组为不完整双链环状DNA,长约3.2 kb,共包含4个部分重叠的开放阅读框架(Pre S/S.Pre C/C,P和X),由于HBV复制过程中具有逆转录阶段,其逆转录酶缺乏校正功能,导致HBV序列呈现高度异质性。根据序列差异,HBV基被划分为10种(A-J)基因型,而每个基因型又可细分为不同亚型[3-1]。基因型B和C是亚洲常见的基因型,其亚型B2、C1和C2广泛分布于中国各地3密码子偏好性是存在于生物界中的一种普遍现象。对病毒而言,密码子偏好性与其自然选择、突变压力、最适宿主的选择以及药物敏感性等密切相关(6-3在预测异源基因的最适宿主、基因表达水平和基因功能等多个应用方面,密码子偏好性分析具有重要作用-10]。有关病毒的全基因组密码子偏好性分析有助于揭示病毒的分子构成、进化过程和逃避宿主免疫的机制。本研究选用亚洲流行的B.C基因型的全基因序列,分析其密码子使用偏向,探讨HBV的密码子使用模式及其进化与人类宿主的关系,以期为HBV相关疾病的基因突变机制提供一些线索。
材料与方法
1序列数据
从GenBank数据库中下载47株HBV B基因型(B1-B9)和C基因型(C1-C16)的全基因组序列,编码长度相近(约3.2 kb)
2分析工具
使用EMBOSS中的CHIP(the codon heterozygosity of a protein coding sequence),CUSP(Create a codon usage table)程序和CodonW软件计算密码子使用指数(The indices of codon table),利用SPSS24.0软件进行统计分析,利用MEGA X软件进行基于病毒编码区核苷酸序列的系统发育分析。
3分析指标
3.1 密码子适应指数 密码子适应指数(Codon adhaptation index,CA1)反映编码区同义密码子与最佳密码子使用频率的相符程度,其值介于0-1之间.CAI值越接近于1,其适应性越强。反之,适应性越弱。
3.2 有效密码子数 有效密码子数(effective num-ber of codon,ENC)是用以衡量基因整体密码子偏倚程度的一个有效指标,取值在20-61之间。当ENC=20时,表示同义密码子完全偏倚;ENC=61时,表示同义密码子完全无偏倚;ENC=35为区分密码子偏性强弱的标准,即ENC值小于35,基因密码子偏好程度较强。反之,基因密码子偏好程度较弱。
3.3 相对同义密码子使用频率 相对同义密码子使用频率(relative synonymous codon usage,RSCU)用于评估不同氨基酸组成的同义密码子使用特征,因其不受氨基酸组成影响,更能直观反映密码子使用偏好性。RSCU=1,表示密码子使用不具偏好性;RsCU值大于1,表示该密码子为使用频率较高的密码子;RSCU值大于1.6的同义密码子被认为过度表达,小于0.6的同义密码子被认为表达不足。
3.4 ENC绘图分析 ENC绘图分析(ENC-Plot)用于检测碱基组成对密码子偏性的影响。以GC3s为横坐标,ENC为纵坐标,作一标准曲线为仅由碱基组成决定基因的预测值,计算公式:ENC=2+GC3s+29/[GC32+(1-GC3s)2]。密码子偏好性受突变压力影响较大的基因分布于标准曲线上及其附近,受自然选择影响较大的基因位于标准曲线下较远处。
3.5 奇偶偏好分析(PR2)PR2 plot用于评估突变压力和翻译选择对基因密码子使用模式的影响。以
AT偏向值[A3/(A3 + T3)]为纵坐标,GC偏向值
[G3/(G3+C3)]作为横坐标。(G3代表密码子第3位核苷酸G;A3代表密码子第3位核苷酸A;C3代表密码子第3位核苷酸C;T3代表密码子第3位核苷酸T.)此图中两个坐标的中心都是0.5,是A=T和G=C(PR2)的位置,意味着此处两条DNA链之间没有偏差,不受突变和翻译选择影响。
3.6 对应分析对应分析(Correspondence analysis)
是一种研究变量和样本之间内在关系的多变量统计方法。在生物体中,除了蛋氨酸(Met)和色氨酸(Trp),所有氨基酸均由一个以上的同义密码子编译5)。因此,去除蛋氨酸和色氨酸以及3个终止密码子,通过分析前两个轴线(轴线1和轴线2)的相关性来解释剩余的59个密码子之间的内在联系及HBV的密码子使用模式。
3.7 中性绘图分析 中性绘图分析(Neutrality Plot)
以GC12为纵坐标,GC3为横坐标,通过分析二者的相关性(GC12是同义密码子第一位和第二位GC含量的平均值,GC3是同义密码子第3位GC含量)来确定影响密码子偏好性的因素。当回归系数等于1时,表明GC12和GC3相关性显著,即三个位置上的碱基组成无明显差异,突变压力为影响密码子使用的主要因素。
反之,说明GC12和GC3相关性不显著,3个位置上的碱基组成不同,自然选择为影响密码子使用的主要因素。
3.8 最优密码子测定 以CAI值为偏好性标准,选取样本中CAI值极高和极低的基因,各占总样本的5%,分别记作高CAI组和低CAI组。运用x检验
(Chi-square test)比较两组之间RSCU值的显著性差异,将高CA1组中极显高于低CAI组(P<0.01)的密码子定义为最优密码子[1)
结果
1同义密码子使用特性
ENC分布范围在56.37-58.74之间,平均值为57.65,标准差为0.582,其平均值大于35,接近于61,提示HBV的密码子使用偏好性总体较弱,即各密码子的使用较均一。CAI值为0.688±0.004,取值范围为0.678-0.697,接近于0.7,表明HBV的基因表达水平相对较高。GC3为0.491±0.006,取值范围为0.474-0.506;GC为0.491±0.003,取值范围为0.485-0.498,对以上各值进行相关性分析,CAI与GC3呈正相关(r=0.500,P<0.01),说明HBV基因表达水平受组成限制影响的可能性较大。
2 ENC-GC3splot
将 ENC值与 GC3s值作图(图1)。
在ENCGC3s plot中,曲线代表具有唯一突变因子的ENC期望值,点代表HBV中编码序列ENC的实际值。根据ENCGC35图,所有病毒都聚集在预期的ENC曲线下方,这表明HBV中的密码子使用模式除了受突变因素影响外,还受到自然选择及其他因素的作用。
3奇偶偏好分析(PR2)
如图2所示,47株病毒均位于y<0.5以下,向左下偏倚。表明同义密码子第3位碱基含量较高的是T和C,T和C在这些病毒中更为常用。当A和T以及G和C的使用频率相等时,密码子偏好性完全受到突变影响。因此,HBV密码子偏好性的影响因素除受突变压力外,还受其他因素的影响。
4中性绘图分析
中性绘图分析(图3)结果显示,GC12与GC3无显著相关性(R2=0.005,P<0.01)。其回归曲线为y=0.5-0.04x,回归系数为0.04,表明突变占4%,自然选择占96%。大多数基因落在对角线的下方,而B3.B6,C8,C10和C14 亚型的部分基因(AB976562
AB287317,MG826137,AB540583,AB644284)R落在对角线上或沿对角线分布。说明大部分HBV的密码子偏好性主要受自然选择的影响,而少部分HBV则受突变压力的影响。
5相对同义密码子使用频率(RSCU)分析
通过计算RSCU值比较HBV不同密码子的使用差异,结果显示,过度表达的密码子共有3个,UCU
(Ser).CCU(Pro)和AGG(Arg);表达不足的密码子共有5个:CUA(Leu)、CCG(Pro)、CGA(Arg)、ACG(Thr)和UCG(Ser),RSCU值>1的密码子共有27个(45.76%),主要以以U/C结尾。显然,高表达的密码子在HBV中并不常见。
为适应宿主,病毒往往进化出与其感染宿主相似
的密码子使用偏好性[12])。为明确B、C基因型在人类宿主内的适应性改变,本研究增补计算B基因型、C基因型及其聚合酶(P)基因、表面(S)基因与人类的密码子使用频率比值,结果见表1。人类的密码子使用频率表从Codon Usage Database获得。当密码子使用频率比值为0.5-2.0时,表示两者的密码子偏好性较为接近。若比值<0.5或>2.0,则表示两者的密码子差异较大。本研究中B,C基因型与人类的密码子使用频率比值>2.0或<0.5的数量均为9个(15.25%),P、S基因中分别有24个(40.68%),17个(28.81%),表明HBV的B.C基因型整体与人类的密码子偏好性较为接近,而B.C型基因组内的P,S基因与人类的密码子偏好性存在一定的差异,P基因较S基因的差异更大,说明HBV的B.C基因型在不同基因区域对宿主的适应性不一致。B基因型与C基因型的密码子使用频率比值在0.5-2.0之间,说明二者的密码子偏好性相近。
6对应分析
运用CodonW软件对RSCU值进行对应分析(图4),每个点代表一种HBV毒株,点距越近,代表病毒密码子使用偏好越相似。轴线1(Aixs1)占总向量的36.67%,轴线2(Aixs2)占总向量的7.90%,前4轴仅能解释变量总方差的57.11%。因此,对B.C基因型密码子使用模式的分析以轴线1为主。对在轴线1上的坐标值与ENC,CA1,GC3和GC值进行相关性分析,显示第一主轴与ENC值呈负相关(r=-0.774,P<0.01),而与CAI(r=0.022,P<0.01)、GC3(r=0.096,P<0.01)及GC(r=-0.025,P<0.01)显著相关性。说明碱基组成不是影响B.C基因型密码子使用模式的主要因素。
对高表达组和低表达组进行x"检验(表2),结果表明两组具有相似的密码子使用模式,密码子GAC和GAA的使用频率在高表达基因中显著增多(P<0.01),因此推测其为HBV基因组中的最优密码子。
7系统发生分析
本研究利用MEGA X软件基于邻近法(NJ)构建系统发育树(图5)。结果显示,B和C基因型相互独立,分别聚为2组,形成1个多系。结合B基因型GC3含量(0.474-0.501)和CAl值(0.678-0.697) 的变化范围,C基因型GC3含量(0.481-0.506)和CA1值(0.670-0.694)的变化范围,二者的变化程度较小且取值相近。说明HBV毒株分类的进化越相近,其密码子偏好性越相似。
讨论
病毒属于非细胞型微生物,在宿主细胞内营寄生生活,其基因表达严重依赖宿主的翻译机制。为此,病毒进化出多种机制来适应宿主,其中最为简单、高效、直接的是宿主密码子的利用。一般而言,病毒蛋白的编码序列(尤其是高表达序列)具有与宿主细胞相类似的密码子使用偏好,有利于病毒蛋白在宿主细胞中高表达。也有研究推测,病毒高表达宿主中罕见的密码子,以此降低病毒蛋白表达,进而减弱宿主免疫反应[2-1],因此,病毒密码子偏好性与病毒生存、适应和进化密切相关。
本研究发现B.C基因型与人类整体密码子使用模式相似,而某些同义密码子使用模式(GAA,GAG AAG,CTA,CTG,TTG,TCA)与人类相异.HBV编码区高度重叠,有70%的HBV编码潜力来自重叠帧的翻译,聚合酶(P)基因与衣壳、X和表面(S)基因有75%的长度重叠[1],对B、C基因型的P基因和S基因与人类密码子使用模式的比较发现P,S基因与人类的密码子使用模式具有一定的差异。S基因较P基因差异更小,这也许与S区域病毒的适应性进化有关[17],将有利于其逃避宿主免疫并中和抗体。以上表明在HBV的进化过程中,宿主对其密码子使用模式具有一定的影响,其可能使用这些与宿主密码子使用模式相似的区域来适应宿主的细胞环境,降低高度表达的首选密码子使用频率以达到整体翻译速率的最大化。B.C基因型的密码子使用模式较为接近,这也许与其物种起源相关。
此外,本研究还发现HBV密码子偏倚较弱,其平均ENC值为57.65,这与其它DNA病毒类似,如杆状病毒(ENC均值为50.54)、多瘤病毒((ENC均值为45.40)[13-13])。以往的研究显示,影响密码子使用模式的主要因素可能是突变压力而不是自然选择[2-21]
然而,本研究中的ENC-GC3s图分析和中性绘图分析表明HBV的密码子使用模式主要受自然选择的影响而非突变压力。因此推测HBV的弱密码子偏倚有利于其首选密码子在宿主细胞中维持较高的翻译效率和活性,逃避宿主免疫,从而在宿主细胞中有效复制。这可能是HBV传播和在宿主体内长期生存的基础。
CodonW的计算结果显示T/C(T>C)>A/G(A>G),RSCU分析表明HBV更喜欢好U/C端密码子。
一项针对HBV相关肝细胞癌(HCC)的研究显示,突变模式(T>C/A>G,C>A/G>T和C>T/G>A转换)在HCC中更具优势[22,因此,这项结果也许能为研究HBV相关疾病提供一定的参考。此外,有研究提出GC含量的丰富性可能会影响病毒的重组率,且高表达基因更富含GC[2],本研究中HBV的GC含量较高,可为HBV B、C基因型重组机制的解释提供一定的参考。
本研究着重分析了亚洲流行的B,C基因型的密码子偏好性及其影响因素,确定了最优密码子为GAC和GAA,发现其密码子偏好性主要受自然选择的影响。针对HBV适应性进化,实施密码子去优化方案,可为新型减毒活疫苗开发及HBV防治提供一定参考。
【参考文献】
[1] Zehender G.Erika E,Elena G,et al.Enigmatic origin of hepati-tis B virus:an ancient travelling companion or a recent encounter?[J.World J Gastroenterol,2014(20):7622-34.
[2] Li L,Shen H,Li AY,et al.Inhibition of hepatitis B virus
(HBV)gene expression and replication by HBx gene silencing in a hydrodynamic injection mouse model with a new clone of HBV genotype B[J].Virol J,2013(10):214.
[3]Bowyer SM,Sim JG,Relationships within and bet ween genotypes of hepatitis B virus at points across the genome:footprints of recombination in certain isolates[J].J Gen Virol,2000(81):379-92.
[4]Zoulim F,Saputelli J,Seeger C.Woodchuck hepatitis virus X protein is required for viral infection in vivo[J].J Virol,1994(68):2026-30
[5]Ginzberg D,Wong RJ,Gish R.Global HBV burden:guesstimates and facts[J].Hepatol Int,2018(12):315-29.
[6]Komar AA.The Yin and Yang of codon usage[J].Hum Mol Genet,2016(25):R77-R85.
[7] Schaefer S. Hepatitis B virus genotypes in Europe[J]. Hepatol Res, 2007 (37): S20-6.
[8] Deb B. Uddin DA, Chakraborty S. Codon usage pattern and itsinfluencing factors in different genomes of hepadnaviruses [J7.Arch Virol, 2020, 165(3): 557-70
[9] Kane JF. Effects of rare codon clusters on high-level expression of heterologous proteins in Escherichia coli[J7. Curr Opin Biotechnol, 1995, 6(5): 494-500.
[10] Gupta SK, Bhattacharyya TK, Ghosh TC. Synonymous codon usage in Lactococcus lactis: mutational bias versus translational selection[J]. J Biomol Struct Dyn, 2004, 21(4): 527-35.
[11] Yang X, Luo XN, Cai XP. Analysis of codon usage pattern in Taenia saginata based on a transcriptome dataset[J]. Parasit Vectors, 2014(7): 527.
[12] Bahir I, Fromer M, Prat Y, et al. Viral adaptation to host: a proteome-based analysis of codon usage and amino acid preferences[J]. Mol Syst Biol, 2009(5): 311.
[13] Mueller S, Papamichail D, Coleman JR, et al. Reduction of therate of poliovirus protein synthesis through large-scale codon deoptimization causes attenuation of viral virulence by lowering specific infectivity[J]. J Virol, 2006(80): 9687-96.
[14] Tindle RW. Immune evasion in human papillomavirus-associated cervical cancer[J]. Nat Rev Cancer, 2002(2); 59-65.
[15] Singh NK, Tyagi A, Kaur R, et al. Characterization of codon usage pattern and influencing factors in Japanese encephalitis virus[J]. Virus Res, 2016(221): 58-65.
[16] Pavesi A. Different patterns of codon usage in the overlapping polymerase and surface genes of hepatitis B virus suggest a de novo origin by modular evolution[J]. J General Virol, 2015, 96(12): 3577-86.
[17] Mizokami M, Orito E, Ohba K et al. Constrained evolution with respect to geneoverlap of hepatitis B virus[J. J Mol Evol,1997(null) : $83-90.
[18] Wang HJ, Meng T, Wei wQ. Analysis of synonymous codon usage bias in helicase gene from Autographa californica multiple nucleopolyhedrovirus[J]. Genes Genomics , 2018(40): 767-80.
[19] Cho M, Kim H, Son HS, et al. Codon usage patterns of LT-Ag genes in polyomaviruses from different host species[J]. Virol J,2019(16): 137.
[20] Zhou JH, Zhang J, Chen HT, et al. Analysis of synonymous codon usage infoot-and-mouth disease virus [J]. Vet Res Commun, 2010(34): 393-404.
[21] Zhao S, Zhang Q, Liu X, et al. Analysis of synonymous codon usage in 11 human bocavirus isolates[J7. Biosystems, 2008(92):207-14.
[22] Fujimoto A, Totoki Y, Abe T, et al. Whole-genome sequencing ofliver cancers identifies etiological influences on mutation patterns and recurrent mutations in chromatin regulators[J]. Nat Genet, 2012(44): 760-4.
[23] Alvarez F, Robello C. Vignali M. Evolution of codon usage and base contents in k in etoplastid protozoans[J]. Mol Biol Evol.1994(11): 790-802..
SCISSCIAHCI