欢迎访问《安徽农学通报》官方网站,今天是
林业科学

黄檗叶绿体基因组密码子偏好性分析

  • 卢梦月 ,
  • 周梦梦 ,
  • 杨俊 ,
  • 吴振宇 ,
  • 王博文 ,
  • 邹玉 ,
  • 杨洪升
展开
  • 佳木斯大学生物与农业学院,黑龙江 佳木斯 154007
杨洪升(1979—),男,黑龙江绥化人,博士,副教授,从事植物资源开发与利用研究。

卢梦月(2003—),女,安徽六安人,从事植物分子生态学研究。

Copy editor: 何艳

收稿日期: 2024-11-22

  网络出版日期: 2025-04-28

基金资助

佳木斯大学大学生创新创业计划训练项目(S202410222085)

佳木斯大学国家自然科学基金培育项目(JMSUGP-ZR2023-010)

Analysis of codon usage bias in chloroplast genome of Phellodendron amurense

  • LU Mengyue ,
  • ZHOU Mengmeng ,
  • YANG Jun ,
  • WU Zhenyu ,
  • WANG Bowen ,
  • ZOU Yu ,
  • YANG Hongsheng
Expand
  • College of Biology and Agriculture, Jiamusi University, Jiamusi 154007, China

Received date: 2024-11-22

  Online published: 2025-04-28

摘要

为探究黄檗叶绿体基因组中密码子的使用偏好及其主要影响因素,采用该乔木叶绿体基因组编码区序列(CDS)筛选,排除长度小于300 bp、含终止密码子及重复序列的片段,最终保留52条有效序列;通过Codon W和CUSP软件计算这些序列的GC含量和有效密码子数(ENC),进一步通过密码子偏好参数的相关性分析探究密码子使用偏好性的影响因素。结果表明,黄檗叶绿体基因组密码子的平均GC含量为39.34%,其中密码子三个碱基的GC含量依次为:GC3(30.32%)< GC2(40.07%)< GC1(47.63%)。密码子偏好参数相关性分析结果显示,密码子的第三位碱基偏好碱基A和U,ENC平均值为49.13,表明密码子使用偏好程度较弱,自然选择压力是影响密码子使用偏好的主要因素。共筛选出10种优化密码子,这些密码子对碱基A和U类型具有显著偏好。本研究为黄檗叶绿体基因工程及密码子优化工作奠定了数据基础。

本文引用格式

卢梦月 , 周梦梦 , 杨俊 , 吴振宇 , 王博文 , 邹玉 , 杨洪升 . 黄檗叶绿体基因组密码子偏好性分析[J]. 安徽农学通报, 2025 , 31(8) : 75 -78 . DOI: 10.16377/j.cnki.issn1007-7731.2025.08.018

Abstract

To explore the codon usage bias and its major influencing factors in the chloroplast genome of Phellodendron amurense, the coding sequences (CDS) of the chloroplast genome of P. amurense were utilized. Fragments shorter than 300 bp, containing stop codons, or repetitive sequences were excluded, ultimately retaining 52 valid sequences. The GC content and effective number of codons (ENC) of these sequences were calculated using Codon W and CUSP software, and the influencing factors of codon preference were further discussed by correlation analysis of codon preference parameters. The findings indicated that the average GC content within the chloroplast genome of P. amurense was 39.34%, with the GC content at the three positions ranked as follows: GC3 (30.32%) < GC2 (40.07%) < GC1 (47.63%). The codon preference parameter correlation analysis revealed a preference for A and U as the third base of the codon, with an average ENC value of 49.13, indicating a weak codon usage bias. Natural selection pressure was identified as the primary factor affecting codon usage bias. Ten optimized codons were identified, which showed a significant preference for the A and U types. This research lays a data foundation and provides a reference for gene engineering and the optimization of codons in the chloroplast genome of P. amurense.

叶绿体基因组的遗传方式为单亲遗传,并具备一定程度的半自主性[1]。这些特征赋予叶绿体基因组在植物学研究领域,特别是植物多样性和系统发育研究中广泛的应用潜力[2]。此外,叶绿体基因组在植物适应性研究中也占有重要部分,通过分析其在不同环境条件下的变异和适应性进化,有助于揭示植物对环境变化的响应机制[3]。密码子作为遗传信息的基本单位,通过不同的编码方式对氨基酸进行编码[4]。由于遗传密码的简并性,同一氨基酸可由多种密码子编码,这些同义密码子在遗传信息的传递过程中发挥重要作用[5]。密码子使用偏好性是指不同物种或同一物种不同基因组区域在使用同义密码子时的选择倾向性,该偏好性的形成受多种因素影响,包括基因组背景、转录和翻译效率、密码子与反密码子配对的适应性等[6]
黄檗(Phellodendron amurense)是芸香科黄檗属多年生落叶乔木,广泛分布于中国东北及华北地区[7]。该植物在中医药领域应用广泛,据现代药理学研究,其含有主要活性成分小檗碱及少量的巴马亭等,具有显著的抗菌和抑菌功能[8]。通过优化密码子,不仅有助于理解黄檗的遗传机制,还可为基因组的改良和目的基因的优化提供重要依据,以提高黄檗中目标基因的表达效率和稳定性,从而提高黄檗的经济价值和药用价值。本研究选取黄檗叶绿体基因组编码区序列为研究对象,分析其基因组中密码子的使用偏好及主要影响因素,为该植物的叶绿体基因组研究和遗传改良提供参考。

1 材料与方法

1.1 数据来源

本研究所使用的黄檗叶绿体基因组数据(登录号:KY707335.1)从NCBI数据库中获得。该基因组的总长度为158 442 bp,包含88个编码序列(Coding DNA sequence,CDS)。在使用MEGA 6软件进行CDS筛选时,排除了重复序列以及长度不足300 bp的序列,最终筛选出52个CDS,用于后续分析。

1.2 分析方法

使用 Codon W 1.4.2 软件分析有效密码子数(Effective number of codons,ENC)、相对同义密码子使用度(Relative synonymous codon usage,RSCU)、密码子数量(N)以及8种氨基酸密码子第三位碱基腺嘌呤(A3)、胸腺嘧啶(T3)、胞嘧啶(C3)和鸟嘌呤(G3)的含量[9]。ENC值的高低可以推断密码子偏好性的强弱。ENC理论取值在20 ~ 61,越靠近20,密码子偏好性越强;越靠近61,密码子偏好性较弱,将45作为判断密码子偏好性强弱的标准。此外,利用CUSP软件评估密码子第一、第二和第三位的GC含量(GC1、GC2、GC3),以及基因组总体GC含量(GCall);进一步采用SPSS 27.0软件分析密码子偏好参数的相关性。使用Excel软件用于绘制中性图表,分析影响密码子使用偏好性的因素。为揭示密码子使用偏好性的潜在影响因素,进行ENC-plot和PR2-plot分析。同时,选择RSCU值≥1的密码子作为高频密码子,计算高表达与低表达密码子的 ΔRSCU(两者之间的差值),通过设定ΔRSCU≥0.08的标准,筛选出高表达密码子,结合RSCU值≥1确定黄檗叶绿体基因组中的最优密码子[10]

2 结果与分析

2.1 黄檗叶绿体基因组的密码子组成

经分析,黄檗叶绿体基因组中52个CDS密码子的GC平均含量为39.34%,密码子第一、第二和第三位的GC含量分别为47.63%、40.07%和30.32%。这些数据揭示出黄檗叶绿体基因组中的密码子的碱基在不同位置上对碱基A或尿嘧啶(U)存在偏好,而非均匀分布。此外,52个CDS的ENC值在37.79~61.00,平均值为49.13,ENC值>45的基因数有44个,表明黄檗叶绿体基因组密码子使用偏好性较弱。
表1可知,GCall与GC1、GC2、GC3间的相关性具有统计学意义(P<0.01),GC1与GC2之间的相关性较高(P<0.05),GC3与GC1、GC2之间的相关性无统计学意义(P>0.05)。这表明GC1与GC2的碱基序列具有较高的一致性。进一步分析显示,ENC值与GC3相关性具有统计学意义(P<0.01),说明密码子使用偏好受第三位碱基影响较大。N值与ENC值之间相关性无统计学意义(P>0.05),表明基因编码序列的长度对密码子使用偏好的影响较小[11]。此外,N与GC1、GC2及GC3之间的相关性无统计学意义(P>0.05),这说明密码子的碱基组成对密码子数量的影响不大。
表1 黄檗叶绿体基因密码子相关参数的相关性
参数 GC1 GC2 GC3 GCall ENC
GC2 0.346*
GC3 0.268 0.081
GCall 0.811** 0.740** 0.520**
ENC 0.205 -0.218 0.386** 0.125
N -0.124 -0.267 0.195 -0.143 0.151

注:*和**表示相关性在0.05和0.01水平具统计学意义。

RSCU分析结果显示,有30个密码子的RSCU值>1。以U为末端碱基的有16个,以A为末端碱基的有13个,仅有1个密码子以G作为末端碱基。表明黄檗叶绿体基因密码子在选择末端碱基时,更倾向A和U。

2.2 中性绘图分析结果

中性绘图分析结果显示,黄檗叶绿体基因组52个CDS的GC12值(GC1和GC2的平均值)在0.343 95~0.582 75,而GC3的值在0.209 1~0.369 8。GC12与GC3的相关性分析显示,二者的相关系数为0.214,未达到统计学显著性水平(P>0.05)(图1)。这一结果表明黄檗密码子的偏好主要受到选择压力的影响。
图1 中性绘图分析结果

2.3 ENC-plot分析结果

ENC-plot分析结果显示(图2),位于标准曲线下方的基因数量更多,表明大多数基因的密码子偏好性受到自然选择的影响[12]。ENC比值频数分布结果显示,ENC比值分布在-0.05~0.05的基因有20个,而另外32个基因的ENC比值则超出该范围(表2)。大部分基因的ENC实际值与期望值之间的差距揭示了黄檗叶绿体基因组的密码子偏好性主要受到选择压力的影响。
图2 黄檗叶绿体基因组ENC-plot分析
表2 ENC 比值频数分布
组段 组中值 频数 频率/%
合计 52 100
-0.25~-0.15 -0.20 0 0
-0.15~-0.05 -0.10 3 5.77
-0.05~0.05 0 20 38.46
0.05~0.15 0.10 23 44.23
0.15~0.25 0.20 5 9.62
0.25~0.35 0.30 1 1.92

2.4 PR2-plot分析结果

PR2-plot分析结果显示(图3),散点在各象限内分布不均,大多数分布在象限下方,表明具有显著偏好性的是密码子的第三位碱基,且4种碱基的使用频率差异显著。表明黄檗叶绿体基因组密码子使用偏好主要受自然选择的影响。
图3 黄檗叶绿体基因PR2-plot分析结果

2.5 最优密码子确定

据RSCU分析结果,在黄檗叶绿体基因组中鉴定出33个高频密码子,这些密码子的RSCU值≥1。其中,29个密码子的ΔRSCU≥0.08,将这些密码子定义为高表达密码子。以ΔRSCU≥0.08且RSCU值≥1为标准,最终筛选出10个最优密码子,即UUU、CUU、CCC、ACA、UAU、CAU、AAU、UGA、AGA和GGA。

3 结论与讨论

针对植物叶绿体基因组中的密码子使用偏好进行系统分析,可探究突变压力和自然选择对其密码子偏好性的影响,并进一步分析碱基组成等其他因素,有助于全面评估这些因素对其密码子使用偏好的潜在影响。研究表明,不同物种在同义密码子使用上的差异,是植物在长期的环境适应和进化过程中形成的特征[13]。该现象主要归因于突变压力和自然选择的双重作用[14-15]。在同义密码子的使用中,主要差别存在于密码子的第三位碱基。
本研究中,有30个密码子的RSCU值>1,其中以U为末端碱基的有16个,以A为终止碱基的有13个,以G为末端碱基的仅1个。这表明黄檗叶绿体基因组的密码子末位碱基偏好使用A或U。ENC值>45的基因有44个,表明黄檗叶绿体基因组密码子使用偏好性较弱。这一结果与荨麻和栽培型向日葵等植物叶绿体基因组的研究结果一致[16],表明不同植物在叶绿体基因组的密码子使用偏好性上存在一定的共性,这与叶绿体基因组的进化和适应性有关。此外,黄檗叶绿体基因组中GC平均含量39.34%,且密码子第一、二位的GC含量高于第三位,这一特征与北沙参等双子叶植物的研究结果相似[17],显示不同植物类别在密码子使用模式上存在一定的相似性,与基因组的结构和稳定性有关。黄檗叶绿体基因组中密码子的末位碱基偏好A或U,这一模式与某些单子叶植物的密码子使用模式类似,说明在不同植物中,密码子的末位碱基偏好受到相似的进化压力和选择机制的影响。然而,尽管存在这些共性,不同植物在密码子使用偏好性和基因组结构上仍表现出显著差异[18]。例如,黄檗叶绿体基因组的密码子使用偏好性较低,而某些植物的叶绿体基因组表现出更高的密码子使用偏好性和较低的ENC值。这种差异与植物的进化历史、环境适应性和基因组结构有关,需进一步试验验证和分析[19]。黄檗叶绿体基因组中GC平均含量39.34%,不同植物的叶绿体基因组中GC含量与基因组碱基组成存在差异,与其特定的生理和生态适应性有关。大多数植物表现出不同的末位碱基偏好,这种差异与植物的翻译效率、mRNA稳定性以及蛋白质合成机制有关,需深入研究探究[20]
本研究分析了黄檗叶绿体基因组水平的密码子使用偏好,并揭示其在突变压力和自然选择影响下的特征。然而,该研究尚不全面,需在未来研究中进一步完善。目前尚未探讨特定基因表达水平和功能影响,以及特定基因的表达模式与其密码子偏好性之间的直接关系。未来研究可结合转录组数据,深入分析特定基因的表达模式及其与密码子使用偏好的关系,以更全面地理解密码子偏好性对基因功能的影响。此外,基因表达调控和环境因素在密码子使用偏好中的潜在影响尚未得到充分评估[19],后续研究应纳入基因表达调控和环境因素,以更全面地评估其对黄檗叶绿体基因组密码子使用偏好的影响。通过多因素分析模型,探讨这些因素在密码子使用偏好中的交互作用和潜在机制,将有助于更全面地理解密码子使用偏好的形成和调控机制。还可以通过基因工程技术,将筛选的最优密码子应用于黄檗的遗传改良,通过试验验证其在提升基因表达效率和改良植物特性方面的实际效果。这不仅有助于提高黄檗的经济和药用价值,还可为其他药用植物的遗传改良提供参考。
1
吴茜,姜梅,陈海梅,等. 旋覆花、湖北旋覆花和线叶旋覆花的叶绿体基因组比较分析和系统发育研究[J]. 药学学报202055(5):1042-1049.

2
李事超,赵诚贵,姜永成,等.黄芪属物种叶绿体基因组蛋白编码基因密码子偏好性分析[J/OL].草业科学1-18(2024-11-10)[2025-4-30].

3
何雯杰,黄华枝,张驰,等. 薇甘菊叶绿体基因组密码子偏好性分析[J]. 广西林业科学202453(3):329-338.

4
柳燕杰,田旭平,李倩. 美国红梣叶绿体基因组密码子偏好性分析[J]. 江苏农业科学202048(15):83-88.

5
刘起麟,李金泽,丁佳渝,等. 蓼属叶绿体基因组密码子偏好性分析及比较特征[J/OL]. 中国农业科技导报1-12(2024-11-10)[2025-4-30].

6
LU Y W CHIU T S. Factors affecting synonymous Codon usage of housekeeping genes in Drosophila melanogaster [J]. Acta biologica hungarica201869(1):58-71.

7
黄治昊,周鑫,张孝然,等. 我国大陆黄檗潜在分布区及分布适宜性评价[J]. 生态学报201838(20):7469-7476.

8
高杨,刘铭,张洪文. 珍稀植物黄檗的药用价值及可持续利用[J]. 中国保健营养201222(4):22-24.

9
屈亚亚,辛静,冯发玉,等. 香花枇杷质体基因组序列密码子偏性分析[J]. 西北林学院学报202136(4):138-144,158.

10
李显煌,杨生超,辛雅萱,等. 灯盏花叶绿体基因组密码子偏好性分析[J]. 云南农业大学学报(自然科学版)2021(3):384-392.

11
秦斗文,徐庭亮,闫京艳,等. 柔毛郁金香叶绿体基因组密码子偏好性分析[J]. 江苏农业科学202351(22):41-47.

12
杨秀玲,许春梅,耿晓珊,等.独脚金叶绿体基因组密码子偏好性分析[J].分子植物育种202321(12):3889-3897.

13
NIE X J DENG P C FENG K W,et al. Comparative analysis of codon usage patterns in chloroplast genomes of the Asteraceae family[J]. Plant molecular biology reporter201432(4):828-840.

14
SUZUKI Y. Statistical methods for detecting natural selection from genomic data[J]. Genes & genetic systems201085(6):359-376.

15
余志伟,陈垣,郭凤霞,等. 菘蓝叶绿体基因组密码子使用偏好性分析[J]. 草地学报202432(8):2374-2385.

16
李魁印,张海玲,张鸿,等. 荨麻叶绿体基因组密码子偏好性分析[J]. 种子202241(2):51-58.

17
赵靖侨,王杰敏,石卫红,等.北沙参叶绿体基因组密码子偏好性分析[J/OL].分子植物育种1-20(2024-11-10)[2025-4-30].

18
尹明华,李文婷,欧阳茜,等.苏丹草叶绿体基因组特征及系统发育分析[J].草业科学202542(1):101-118.

19
王文斌,于欢,邱相坡. 黄芩叶绿体基因组重复序列及密码子偏好性分析[J]. 分子植物育种201816(8):2445-2452.

20
陆奇丰,骆文华.广西秋海棠叶绿体基因组密码子偏好性分析[J/OL].分子植物育种,1-20(2024-11-10)[2025-4-30].

文章导航

/