-
蒟蒻薯属(Tacca)是薯蓣科(Dioscoreaceae)中一个较小的属,包含约15种植物,广泛分布在热带和亚热带地区。这些植物因含有丰富的天然活性成分,被广泛用于治疗各种疾病(贾敏如和李星炜,2005)。如裂果薯的根部含有丰富的箭根酮内酯、皂苷和黄酮等化学成分,具有抗肿瘤、清热解毒、理气止痛和凉血散瘀的功效(孙悦文,2013)。此外,常被用于治疗跌打损伤、急性肠胃炎和疮疡肿毒等疾病(云南省药材公司,1993)。此外,该属植物的观赏价值也很高,聚伞形的花序大而美丽,在园艺植物中广受青睐。近年来,由于生境破坏、过度开采和气候变化等因素,许多种类面临着濒危的风险(傅立国和金鉴明,1992)。因此,加强对其保护和可持续利用至关重要。然而,当前对蒟蒻薯属的研究主要集中在显微鉴定、活性物质分离、药理药效和组织培养等方面(王慧明等,2004; Liu et al.,2006; Jiang et al.,2014; 秦燕萍等,2023),关于其系统发育关系、物种遗传多样性和种质资源保护的相关研究仍然相对较少(Zhang et al.,2011)。值得注意的是,蒟蒻薯属植物的分类标准一直存在争议,物种界定的差异很大。自1881年建立裂果薯属(Schizocapsa)以来,学者围绕着是否将裂果薯属归并到蒟蒻薯属的问题争论不休。Drenth(1972)认为裂果薯属不能另立一属,因为开裂的果实特征不足以界定一个新属。在国际植物学名录中,裂果薯已被归类到蒟蒻薯属下,并且将广西裂果薯(S. guangxiensis)与裂果薯(T. plantanginea)归并为同一物种。然而,也有学者认为广西裂果薯和裂果薯是两个不同的物种:叶薄纸质 vs. 叶纸质;外轮花被片宽圆形,内轮花被片比外轮花被裂片小l/2左右 vs. 外轮花被片披针形,内轮花被片卵圆形,内轮花被片比外轮花被裂片稍短而宽;蒴果3瓣裂至中部 vs. 蒴果3瓣裂至基部(Zhu,2000)。此外,根据两属植物的染色体数目和叶表皮气孔类型的差异,认为裂果薯属不能归并到蒟蒻薯属,而应独立出来为宜(凌萍萍和丁志遵, 1982; 凌萍萍,1985; 中国科学院生物多样性委员会,2023)。随着DNA条形码技术的发展和日趋成熟,Zhang等(2011)使用ITS、atpA、rbcL、 trnH-psbA和trnL-F条形码重构蒟蒻薯属物种的系统发育树来推断属内物种的系统发育关系,然而该研究缺乏广西裂果薯样本,未涉及解释属和种的归并问题。
-
叶绿体是植物体内具有独立遗传物质的多功能细胞器,其基因组结构高度保守,为典型的双链环状四分体结构,即由一个大单拷贝区(large single copy,LSC)、一个小单拷贝区(small single copy,SSC)和两个反向重复序列(inverted repeats,IRa和IRb)组成(Dobrogojski et al.,2020)。不同植物叶绿体基因组之间的结构差异主要体现在IR区的长度和方向上的变化,这是导致基因组大小变化和单拷贝基因转化为重复基因的主要因素(Mehmood et al.,2020)。叶绿体基因组的基因按功能可以分为与光合作用相关基因、自身编码基因和未知的开放阅读框(Dobrogojski et al.,2020)。由于生境条件各异,不同植物使用的密码子偏好性也存在一定的差异(Zhou et al.,2008)。与核基因组和线粒体相比,叶绿体基因组在结构、基因数量和基因组成方面呈现出更高的保守性,其相对适中的进化速率介于核基因组和线粒体基因组之间(CBOL Plant Working Group,2009)。目前,已有多个叶绿体基因片段被开发用于物种鉴定、系统发育和群体遗传多样性的研究(CBOL Plant Working Group,2009)。近年来,借助高通量测序技术对叶绿体全基因组进行分析,可以更加清晰地了解物种间的系统发育关系、种群的遗传结构以及准确鉴定近缘物种(Daniell et al.,2021)。
-
本研究利用高通量测序技术对广西裂果薯进行叶绿体全基因组测序,结合公共数据库中已公开发表的蒟蒻薯属植物叶绿体基因组,拟探讨以下问题:(1)通过叶绿体基因组比较揭示广西裂果薯和裂果薯的遗传差异程度;(2)通过构建叶绿体基因组系统发育树来推断广西裂果薯和裂果薯的亲缘关系,为广西裂果薯的归并问题提供新的分子证据。
-
1 材料与方法
-
1.1 实验材料和数据来源
-
广西裂果薯植物采集自广西壮族自治区中国科学院广西植物研究所。物种身份已经过该单位陆昭岑助理研究员的准确鉴定(图1)。采集3片幼嫩叶片,用自来水冲洗干净后保存于硅胶中干燥,用其提取总DNA。此外,我们通过NCBI数据库(The National Center for Biotechnology Information)检索并下载已公开发表的22个物种叶绿体基因组全长序列,包括21个薯蓣科物种,分别是参薯 [Dioscorea alata(OP 787126)]、异叶薯蓣 [D. biformifolia(OQ 526002)]、D. brevipetiolata(NC 062811)、黄独 [D. bulbifera(NC 039708)]、D. cayenensis(MZ 848368)、薯莨 [D. cirrhosa(NC 065059)]、三角叶薯蓣 [D. deltoidea(OQ 525993)]、D. depauperata(NC 062812)、龟甲龙 [D. elephantipes(NC 009601)]、福州薯蓣 [D. futschauensis(NC 039808)]、褐苞薯蓣 [D. persimilis(NC 057257)]、D. praehensilis(NC 039837)、昆氏薯蓣 [D. quinquelobata(NC 057067)]、D. sagittifolia(NC 039854)、善司芭润斯薯蓣 [D. sansibarensis(NC 039838)]、绵萆薢 [D. spongiosa(OQ 525998)]、山萆薢 [D. tokoro(OQ 525999)]、盾叶薯蓣 [D. zingiberensis(NC 027090)]、箭根薯 [Tacca chantrieri(KX 171420)]、蒟蒻薯 [T. leontopetaloides(NC 036658)]、裂果薯 [T. plantanginea(MT419421.1)]和1个外类群石蒜科物种葱莲 [Zephyranthes bifida(NC 064147.1)]。
-
1.2 DNA提取和测序
-
采用十六烷基三甲基溴化铵(CTAB)法提取广西裂果薯总DNA(Doyle &Doyle,1987),分别使用琼脂糖凝胶电泳和NanoDrop-2000紫外分光光度计(Thermo Fisher Scientific,USA)检测DNA的质量和浓度。利用Illumina HiSeq 2000平台进行双端测序,测序读长为150 bp。利用FastaQ软件过滤原始数据,除去多余的N序列、特异性接头序列和过短序列,获得总数据量为5 200.34 Mb的高质量测序数据(clean data)用于后续的叶绿体基因组组装。
-
1.3 叶绿体基因组组装和注释
-
将上述获得的clean data序列导入GetOrganelle v1.7.5.0软件(Jin et al.,2020)从头进行叶绿体基因组组装,参数值设置为默认值。将组装结果文件.gfa导入Bandage 软件中,对组装完整度进行可视化分析(Wick et al.,2015)。使用在线叶绿体注释平台CPGAVAS2(http://47.96.249.172:16019/analyzer/home)以裂果薯(MT419421.1)为参照基因组,对叶绿体的蛋白质编码基因、tRNA和rRNA进行注释(Shi et al.,2019)。使用GB2sequin检查基因序列(Lehwark &Greiner,2019),尤其是具有短外显子和RNA编辑的起始密码子基因,并手动校正错误的注释。通过在线可视化工具OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)绘制叶绿体基因组圈图(Greiner et al.,2019)。完整的广西裂果薯叶绿体基因组信息已上传至NCBI数据库,登录号为OR 805469。
-
1.4 密码子使用偏好性分析
-
密码子使用偏好性是物种遗传变异和自然选择而共同产生的结果。本研究利用CodonW v1.4.4软件对叶绿体基因组的蛋白编码基因进行偏好性分析,并对相对同义密码子使用度(relative synonymous codon usage,RSCU)进行计算(Gupta et al.,2004)。为了减少误差,选择蛋白质编码区长度≥300 bp。通过R语言heatmap包对RSCU进行可视化。当RSCU值>1时,表明该密码子的使用频率高于其他同义密码子;当RSCU值=1时,表明该密码子无使用偏好性;当RSCU值<1时,表明该密码子的使用频率低于其他同义密码子(王婧等,2019)。
-
1.5 重复序列分析
-
利用MISA在线分析网站(https://webblast.ipk-gatersleben.de/misa)统计叶绿体基因组中的简单重复序列(simple sequence repeats,SSR)(Beier et al.,2017),参数采用默认值,即单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸的最小重复次数分别为10、8、4、3、3、4,SSR之间的最小距离设为100 bp。对于其他类型的散在重复序列,我们利用REPuter在线分析网站(https://bibiserv.cebitec.uni-bielefeld.de/reputer/manual.html)进行鉴定,参数设置为最小重复序列 30 bp,汉明距离(Hamming distance)设置为3(Kurtz et al.,2001)。
-
1.6 叶绿体基因组IR边界比较和分歧区域鉴定
-
不同植物的叶绿体基因组在IR边界区有不同程度的收缩和扩张,是反映叶绿体基因组进化特征的主要信息,其中反向重复区在稳定叶绿体结构方面发挥着重要作用。为了更清晰地展示广西裂果薯和裂果薯叶绿体基因组的IR边界差异信息,我们采用IRscope在线分析网站(https://irscope.shinyapps.io/irapp/)对2个物种的叶绿体基因组边界进行可视化分析(Amiryousefi et al.,2018)。对于序列分歧区的鉴定,我们利用mVISTA在线分析软件(https://genome.lbl.gov/vista/index.shtml)中的Shuffle-LAGAN模型,以裂果薯为参考物种,对广西裂果薯和蒟蒻薯属3个物种的叶绿体基因组进行同源性比对(Frazer et al.,2004)。
-
1.7 系统发育分析
-
本研究从NCBI数据库下载已发表的22个叶绿体基因组全长序列,包括21个薯蓣科物种和1个外类群物种(石蒜科葱莲)。使用PhyloSuite(V1.2.3)软件中的MAFFTv7插件进行序列比对和矩阵构建,利用IQ-TREE 2以最大似然法(maximum likelihood,ML)构建系统发育树,参数设置为默认(Minh et al.,2021)。将得到的树文件导入到FigTree软件中进行进化系统树优化。
-
2 结果与分析
-
2.1 密码子使用偏好性
-
植物在分化之前所使用的遗传密码子是相似的,在演化过程中由于基因突变和自然选择而导致不同生境下的个体具有特定偏好的密码子,最后分化成不同的物种(Romero et al.,2000)。本研究利用生信云在线网站工具分析了广西裂果薯和裂果薯叶绿体基因组的蛋白质编码序列相对同义密码子使用度(RSCU)。结果显示,广西裂果薯叶绿体的蛋白质编码区总长85 844 bp,共编码54 049个密码子,64种密码子中,共编码20种氨基酸,其中UAA、UAG、UGA为终止密码子。广西裂果薯和裂果薯编码率最高的密码子都是AGA(Arg,精氨酸),但裂果薯编码率(2.03)比广西裂果薯(1.96)的高(图2)。广西裂果薯和裂果薯使用密码子偏好性最低的是CGC(Arg,精氨酸),使用度RSCU都为0.42。此外,二者使用的AUG(Met,蛋氨酸)和UGG(Trp,色氨酸)的RSCU都为1.00,表明没有密码子偏好性,但是其他大多数氨基酸都显示出密码子偏向。广西裂果薯密码子RSCU>1共有30个,而裂果薯密码子RSCU>1共有31个,其中GGG(Gly,甘氨酸)在裂果薯中RSCU高于广西裂果薯。二者密码子RSCU > 1并且第三位以A/T(U)结尾的密码子同为28个,广西裂果薯以G碱基结尾的只有1个(AGG),而裂果薯以G碱基结尾的有2个(AGG、GGG),二者以C碱基结尾的都为1个(UCC)。广西裂果薯密码子RSCU<1共有29个,而裂果薯密码子RSCU<1共有28个,二者大多数密码子都以C或G结尾,RSCU偏低(图2)。以上分析结果表明,广西裂果薯与裂果薯叶绿体基因组密码子偏好使用都以A/T(U)结尾的密码子,但是二者在密码子使用度上存在差异。
-
图1 裂果薯和广西裂果薯的形态特征
-
Fig.1 Morphological characteristics of Tacca plantaginea and Schizocapsa guangxiensis
-
2.2 重复序列分析
-
SSR是广泛存在于叶绿体基因组中的重复序列,由于其重复类型和数量丰富、共显性遗传、实验结果重复性高等优点,常用于近缘物种鉴定和物种群体的遗传多样性分析(Bayliss et al.,2004)。由图3:A可知,从广西裂果薯叶绿体基因组中鉴定了66个SSR位点,裂果薯中鉴定了58个。两者的SSR类型有单核苷酸、二核苷酸、三核苷酸、四核苷酸和五核苷酸(图3:B)。此外,单核苷酸A/T重复单元的比例最高,在广西裂果薯中占总SSR种类的72.73%,在裂果薯中占总SSR种类的68.96%。五核苷酸重复最少,广西裂果薯有2个,占总SSR种类的3.03%,裂果薯只有1个,占总SSR种类的1.72%(图3:B)。二者都没有检测到六核苷酸。广西裂果薯和裂果薯中A/T、AT/AT、AAT/ATT、AAAT/ATTT、AATT/AATT和AATAT/ATATT重复基序分别占总SSR的84.85%和86.21%(图3:A),表明两物种都偏好使用A和T碱基。
-
图2 广西裂果薯和裂果薯的RSCU值热图
-
Fig.2 RSCU heat maps of Schizocapsa guangxiensis and Tacca plantaginea
-
散在长重复序列的鉴定结果显示,广西裂果薯的叶绿体中含有45个长重复序列,包含21个回文重复序列、14个正向重复序列、6个反向重复序列、4个互补重复序列(图4:A)。裂果薯具有48个重复,包含19个回文重复序列、17个正向重复序列、9个反向重复序列、3个互补重复序列(图4:A)。这些重复序列主要位于蛋白质编码区。两者的回文重复序列的长度集中在30~60 bp之间(图4:A),占长重复序列种类的46.67%和39.58%(图4:B)。
-
2.3 叶绿体基因组IR边界分析
-
叶绿体基因组边界的收缩与扩增现象能够揭示叶绿体基因组结构变化和进化过程(Yang et al.,2023)。为了观察广西裂果薯IR区是否发生收缩或扩张,我们对广西裂果薯和已发表的3个蒟蒻薯属物种箭根薯、蒟蒻薯和裂果薯进行可视化分析(图5)。4种植物叶绿体基因组均为环形四分体结构,在LSC、IRb、IRa和SSC区域中可划分为4个边界,即LSC/IRb边界、IRb/SSC边界、SSC/IRa边界和IRa/LSC边界。rpl22、rps19、trnH、rpl2、ycf1和psbA等基因存在于LSC/IRb、IRb/SSC、SSC/IRa和IRa/LSC边界的交界处。我们发现不同蒟蒻薯植物的叶绿体基因组边界存在明显的差异,不同长度的rps19基因在4个物种中均位于LSC区,广西裂果薯和裂果薯的rps19基因距离IRb/LSC边界都为74 bp,而在箭根薯和蒟蒻薯中分别为8 bp和4 bp。在裂果薯和箭根薯中,ndhA基因横跨IRb/SSC边界,并向SSC区域分别延伸718 bp和794 bp,而广西裂果薯和蒟蒻薯的ndhA基因横跨IRa/LSC边界,并分别向SSC区域延伸778 bp和838 bp。在广西裂果薯和蒟蒻薯中,ndhF基因横跨IRb/SSC边界,并向IRb区分别延伸106 bp和90 bp,而裂果薯的ndhF基因横跨IRa/SSC边界并向IRa区延伸206 bp,只有箭根薯ndhF基因均在SSC区并距离IRa/SSC边界29 bp。4个物种psbA基因均位于LSC区,并距离IRa/SSC边界54~61 bp。以上结果表明,广西裂果薯和裂果薯的LSC/IRb边界和IRa/LSC边界信息一致,主要的变异发生在IRb/SSC边界和SSC/IRa边界上,也是叶绿体基因组长度存在差异的主要原因。
-
图3 广西裂果薯和裂果薯叶绿体基因组的简单重复序列分布
-
Fig.3 Distribution of different types of SSRs in Schizocapsa guangxiensis and Tacca plantaginea chloroplast genomes
-
图4 广西裂果薯和裂果薯叶绿体基因组不同类型的重复序列分布
-
Fig.4 Distribution of different types of sequence repeats of Schizocapsa guangxiensis and Tacca plantaginea
-
2.4 叶绿体基因组序列分歧鉴定
-
本研究通过mVISTA在线工具分析了广西裂果薯和蒟蒻薯属3个物种的叶绿体基因组序列的分歧位点。图6结果显示,广西裂果薯与裂果薯、蒟蒻薯、箭根薯序列相似度较高。编码区变异程度较低且在IRa和IRb 区无明显变异,如ycf2、rrn23、ndhB、rps12、ndhH、trnV-GAC基因具有较高的保守性。但是,广西裂果薯与其他3个物种相比,在非基因编码区存在明显的差异,其中LSC区和SSC区的多样性和变异程度较高,如trnK-UUU-trnQ-UUG、trnS-GCU-trnG-UCC、atpF、atpH-atpI、rpoB-trnC-GCA、trnE-UUC-trnT-GGU、ndhC-trnV-UAC、rbcL-accD、ycf4、petA-psbJ、rpl14-rpl16、ndhA、ccsA和ndhD序列差异较大(图6)。这些分歧程度高的位点可以开发为属内物种鉴定的分子标记。
-
图5 广西裂果薯和蒟蒻薯属3个物种叶绿体基因组的IR边界分析
-
Fig.5 Boundary analysis of IR regions of chloroplast genomes from Schizocapsa guangxiensis and three Tacca species
-
2.5 广西裂果薯叶绿体基因组特征
-
广西裂果薯叶绿体基因组物理谱图为典型的环状双链四分体结构(图7),其中包括1个LSC区、1个SSC区和2个IR区。广西裂果薯和裂果薯的叶绿体基因组全长分别为162 149 bp和160 749 bp,两者序列长度差异为1 400 bp,总的GC含量都是36.90%。两种植物的LSC长度分别为84 541 bp和84 671 bp,SSC长度分别为10 072 bp和8 318 bp,IR长度分别为33 768 bp和33 880 bp(表1)。广西裂果薯和裂果薯叶绿体基因组的基因种类和数目完全一致,注释到132个基因,包括89个蛋白质编码基因,37个tRNA基因和6个rRNA编码基因(表1)。广西裂果薯与光合作用相关的基因44个、自我复制相关的基因54个、其他基因功能相关的基因6个和未知功能相关基因5个(表2)。在这些基因中,ndhA、ndhB、atpF、rpoC1、rps12、rpl16、rpl2、trnA-UGC、trnE-UUC、trnK-UUU、trnL-UAA、trnT-CGU各含有1个内含子,而基因ycf3、clpP各含有2个内含子(表2)。
-
2.6 广西裂果薯的系统进化分析
-
通过分析物种间的系统发育关系,可以帮助我们理解物种间亲缘关系和演化途径。本研究将石蒜科葱莲属葱莲作为外类群,结合广西裂果薯和其他21个薯蓣科的物种,运用最大似然法(ML)构建了系统发育树,得到了一致的拓扑结构。结果表明,22个薯蓣科物种主要分为3个分支:分支I(Clade I)和分支Ⅲ(Clade Ⅲ)为薯蓣科薯蓣属(Dioscorea)、分支Ⅱ(Clade Ⅱ)为薯蓣科蒟蒻薯属(Tacca)。广西裂果薯与箭根薯以100%的支持率聚为了一个单支,表明这两个物种的亲缘关系最近,其次是100%支持率的蒟蒻薯和裂果薯(图8),表明广西裂果薯和裂果薯的亲缘关系较远。
-
3 讨论与结论
-
在本研究中,我们组装了广西裂果薯的完整叶绿体基因组。广西裂果薯叶绿体基因组具有典型的四分体结构,与同科其他物种类似。通过比较已发布的蒟蒻薯属物种叶绿体基因组,我们发现它们之间的基因种类和数量、顺序、结构和其他特征高度保守。广西裂果薯和裂果薯偏好使用的密码子频率不一致。在非编码区也存在一些分歧度较高的序列,可开发为属内物种鉴定的分子标记。现有的叶绿体基因组数据的系统发育分析证明广西裂果薯与箭根薯关系最为密切。
-
图6 广西裂果薯和蒟蒻薯属3个物种叶绿体基因组序列差异分析
-
Fig.6 Analysis of sequence divergence in chloroplast genomes between Schizocapsa guangxiensis and three Tacca species
-
通常高等植物的叶绿体基因组长度在120~160 kb范围内,而广西裂果薯和裂果薯的叶绿体基因组全长分别为162 149 bp和160 749 bp,两者序列长度差异为1 400 bp。与其他被子植物类似,两物种叶绿体基因组的IR区检测到高GC含量,这可能是由于rRNA序列富含GC的结果。内含子在基因选择性剪接中起着至关重要的作用,然而也有一些物种在进化过程中丢失了内含子(Qian et al.,2013)。本研究发现薯蓣科植物的叶绿体基因组在进化过程中没有丢失任何内含子,暗示该科植物叶绿体基因组的蛋白质编码基因高度保守。密码子使用偏好性能反映物种基因的起源、进化和突变模式,对物种进化和遗传研究都有重要意义(Quax et al.,2015)。通过对广西裂果薯和裂果薯叶绿体密码子统计发现,尽管精氨酸(Arg)是两者使用最多的氨基酸,但是两物种所使用的密码子频率不一样,甚至其他密码子的使用频率也存在一定的差异,此结果对于探索它们在进化过程中所经受的选择压力以及物种分化提供了理论依据。在优选密码子(RSCU>1)中,我们发现除了UUG之外,大多数密码子以A或U结尾,但这并不是广西裂果薯叶绿体基因组所独有的,在单子叶植物水稻和玉米、双子叶植物丹参和烟草中也观察到了相似的现象(Qian et al.,2013;Asaf et al.,2016)。尽管同源基因在不同物种中具有相似的功能,但是不同物种在进化过程中由于所处的生存条件差异很大,自然会偏好选择适应该环境的遗传变异并固定下来,最终导致基因亚功能化而发生物种分化。根据RSCU的结果,我们认为广西裂果薯和裂果薯之间可能已经发生物种分化。
-
图7 广西裂果薯的叶绿体基因组圈图
-
Fig.7 Chloroplast genome map of Schizocapsa guangxiensis
-
SSR已被广泛应用于群体遗传学、系统发育评估和近缘物种或品种的鉴定,是区分较低分类水平物种的重要分子标记(Torokeldiev et al.,2019)。我们发现叶绿体基因组的大多数SSR都位于SSC和LSC区域的非编码区,占SSR总数的80%以上。在广西裂果薯叶绿体基因组中检测到66个SSR,但裂果薯只有58个。两者都含有相同的重复类型,但在不同类型中的数量有所差异。在许多植物叶绿体基因组中,Poly(A/T)的SSR通常比其他SSR重复类型更常见,这类SSR主要位于非编码区,通常代表种内变异的重复次数,而二核苷酸及以上重复的SSR主要位于基因序列中,是基因功能发生变化最终形成新物种的动力之一(Tuler et al.,2015)。因此,本研究中检测到的SSR位点可为广西裂果薯遗传多样性水平分析和近缘物种鉴定提供新的分子标记。散在长重复序列也在基因组结构变异和物种分化中发挥着重要作用(Cavalier,2002)。大多数重复序列位于基因间隔区域,其次是编码区域。本研究中,广西裂果薯有21个回文重复序列、14个正向重复序列、6个反向重复序列、4个互补重复序列;而裂果薯具有19个回文重复序列、17个正向重复序列、9个反向重复序列、3个互补重复序列。由此可知,二者在散在长重复序列的数目上有明显的差异性,是两物种遗传物质变异的分子证据。
-
虽然被子植物的叶绿体基因组在结构和大小上相对保守,但是由于进化事件引起的IR区域的扩张和收缩会导致基因组的IR边界和基因组大小发生微量变化,从而增加了被子植物叶绿体的遗传多样性(He et al.,2017)。我们发现广西裂果薯和蒟蒻薯属物种的叶绿体基因组IR区长度基本相似,尤其是IRb/LSC和IRa/LSC的边界大致相同,主要差异发生在IRb/SSC和SSC/IRa边界上,这是导致SSC区长度发生变化的主要原因。在许多被子植物的叶绿体基因组中IRb区的ycf1基因经常形成假基因化。然而,广西裂果薯的IR区向SSC区发生明显的扩张现象,形成了完整的ycf1基因。IR区的扩张也是导致广西裂果薯叶绿体基因组变大的主要因素。此外,我们在蒟蒻薯属其他物种中也观察到以上现象。基于IR区边界分析结果,我们推测广西裂果薯可能归属于蒟蒻薯属。由于形态上的相似性,利用传统的方法对近期分化的物种进行准确区分具有非常高的挑战性。对于某些特殊的物种,即使是使用标准DNA植物条形码也无法区分,必要时,需针对特定物种开发物种特异性的分子标记(Zhao &Woeste,2011)。基于mVISTA比较分析,我们发现IR区域比LSC和SSC区域更加高度保守,并且编码区域比非编码区域保守性高,这与其他被子植物类似(Qian et al.,2013)。广西裂果薯叶绿体基因组中的LSC和SSC区域具有一些高水平变异序列,多数位于基因间隔区上。这些高度变异的区域可能具有解决该属物种鉴定和构建高分辨率系统发育树的能力,可以作为候选的蒟蒻薯属特异性DNA条形码。
-
叶绿体基因组含有丰富的变异位点,作为植物鉴定的“超级条形码”能通过基因的缺失和排列顺序等方面来鉴定物种,在物种系统发育分析中具有独特优势。大量研究表明,叶绿体基因组在近缘物种、居群及个体间均能实现高效鉴定,与传统分子系统学研究相比,基于叶绿体全基因组序列构建系统发育树具有更高的支持率和分辨率(Daniell et al.,2021)。根据传统的形态分类,裂果薯属已被归入蒟蒻薯属,并且《中国植物志》将广西裂果薯归并为裂果薯(中国科学院中国植物志编辑委员会,1985)。然而,2023版中国生物物种名录中仍然将裂果薯属作为独立的一属。在本研究中,我们检索公共数据库中可用的薯蓣科叶绿体基因组,并基于ML方法推断广西裂果薯和裂果薯的系统发育关系,结果显示广西裂果薯和箭根薯聚为一支(支持率100%),而裂果薯以100%的支持率位于蒟蒻薯属的基部,表明广西裂果薯和裂果薯是两个完全不同的物种。然而,有限的类群信息会导致不同的拓扑系统树,为了可靠地推断物种系统发育关系,我们有必要对蒟蒻薯进行全面采样。总体而言,广西裂果薯完整的叶绿体基因组可为该属和种的分类修订提供新的分子依据。
-
注: *表示存在1个内含子; **表示存在2个内含子。(2)和(4)分别表示该基因有2个和4个拷贝。
-
Note: * indicates the presence of one intron; ** indicates the presence of two introns. (2) and (4) indicates the gene has two and four copies, respectively.
-
图8 基于23个物种的叶绿体全基因组的系统发育树
-
Fig.8 Phylogenetic tree based on complete chloroplast genomes from 23 species
-
参考文献
-
AMIRYOUSEFI A, HYVÖNEN J, POCZAI P, 2018. IRscope: an online program to visualize the junction sites of chloroplast genomes [J]. Bioinformatics, 34(17): 3030-3031.
-
ASAF S, KHAN AL, KHAN AR, et al. , 2016. Complete chloroplast genome of Nicotiana otophora and its comparison with related species [J]. Front Plant Sci, 7: 843.
-
BAYLISS CD, DIXON KM, MOXON ER, 2004. Simple sequence repeats (microsatellites): mutational mechanisms and contributions to bacterial pathogenesis. A meeting review [J]. FEMS Immunol Med Microbiol, 40(1): 11-19.
-
BEIER S, THIEL T, MÜNCH T, et al. , 2017. MISA-web: a web server for microsatellite prediction [J]. Bioinformatics, 33(16): 2583-2585.
-
Biodiversity Committee, Chinese Academy of Sciences, 2023. Catalogue of Life China 2023 Annual Checklist [M]. Beijing: Science Press. [中国科学院生物多样性委员会, 2023. 中国生物物种名录(2023版) [M]. 北京: 科学出版社. ]
-
CAVALIER T, 2002. Chloroplast evolution: secondary symbiogenesis and multiple losses [J]. Curr Biol, 12(2): R62-R64.
-
CBOL Plant Working Group, 2009. A DNA barcode for land plants [J]. Proc Natl Acad Sci USA, 106(31): 12794-12797.
-
Chinese Academy of Sciences Editorial Committee for Flora of China, 1985. Flora Reipublicae Popularis Sinicae: Volume 16. Part 1 [M]. Beijing: Science Press. [中国科学院中国植物志编辑委员会, 1985. 中国植物志: 第十六卷第一分册 [M]. 北京: 科学出版社. ]
-
DANIELL H, JIN S, ZHU XG, et al. , 2021. Green giant-a tiny chloroplast genome with mighty power to produce high-value proteins: history and phylogeny [J]. Plant Biotechnol J, 19(3): 430-447.
-
DOBROGOJSKI J, ADAMIEC M, LUCINSKI R, 2020. The chloroplast genome: a review [J]. Acta Physiol Plantarum, 42: 1-13.
-
DOYLE JJ, DOYLE JL, 1987. A rapid DNA isolation procedure for small quantities of fresh leaf tissue [J]. Phytochemical Bull, 19: 11-15.
-
DRENTH E, 1972. A revision of the family Taccaceae [J]. Blumea, 20: 367-406.
-
FRAZER KA, PACHTER L, POLIAKOV A, et al. , 2004. VISTA: computational tools for comparative genomics [J]. Nucl Acids Res, 32(2): W273-W279.
-
FU LK, JIN JM, 1992. China plant red data book: rare and endangerad plants: Part 1 [M]. Beijing: Science Press: 642-643. [傅立国, 金鉴明, 1992. 中国植物红皮书-稀有濒危植物: 第1册 [M]. 北京: 科学出版社: 642-643. ]
-
GREINER S, LEHWARK P, BOCK R, 2019. Organellar Genome DRAW (OGDRAW) version 1. 3. 1: expanded toolkit for the graphical visualization of organellar genomes [J]. Nucl Acids Res, 47(W1): W59-W64.
-
GUPTA SK, BHATTACHARYYA TK, GHOSH TC, 2004. Synonymous codon usage in Lactococcus lactis: mutational bias versus translational selection [J]. J Biomol Struct Dyn, 21(4): 527-536.
-
HE L, QIAN J, LI X, et al. , 2017. Complete chloroplast genome of medicinal plant Lonicera japonica: genome rearrangement, intron gain and loss, and implications for phylogenetic studies [J]. Molecules, 22(2): 249.
-
JIANG J, YANG H, WANG Y, et al. , 2014. Phytochemical and pharmacological studies of the genus Tacca: a review [J]. Trop J Pharm Res, 13(4): 635-648.
-
JIA MR, LI XW, 2005. Zhongguo Minzu Yaozhi Yao [M]. Beijing: China Medical Science and Technology Press. [贾敏如, 李星炜, 2005. 中国民族药志要 [M]. 北京: 中国医药科技出版社. ]
-
JIN JJ, YU WB, YANG JB, et al. , 2020. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes [J]. Genome Biol, 21(1): 241.
-
KURTZ S, CHOUDHURI JV, OHLEBUSCH E, et al. , 2001. REPuter: the manifold applications of repeat analysis on a genomic scale [J]. Nucl Acids Res, 29(22): 4633-4642.
-
LEHWARK P, GREINER S, 2019. GB2sequin — A file converter preparing custom GenBank files for database submission [J]. Genomics, 111(4): 759-761.
-
LING PP, DING ZZ, 1982. Two new species of Taccaceae from China [J]. Acta Phytotaxon Sin, 20(2): 201-204. [凌萍萍, 丁志遵, 1982. 中国蒟蒻薯科二新种 [J]. 植物分类学报, 20(2): 201-204. ]
-
LING PP, 1985. Flora Reipublicae Popularis Sinicae: Volume 16. Part 1 [M]. Beijing: Science Press: 42-44. [凌萍萍, 1985. 中国植物志: 第十六卷第一分册 [M]. 北京: 科学出版社: 42-44. ]
-
LIU HY, NI W, XIE BB, et al. , 2006. Five new withanolides from Tacca plantaginea [J]. Chem Pharm Bull, 54(7): 992-995.
-
MEHMOOD F, ABDULLA H, SHAHZADI I, et al. , 2020. Characterization of Withania somnifera chloroplast genome and its comparison with other selected species of Solanaceae [J]. Genomics, 112(2): 1522-1530.
-
MINH BQ, SCHMIDT HA, CHERNOMOR O, et al. , 2021. IQ-TREE 2: new models and efficient methods for phylogenetic inference in the genomic Era [J]. Mol Biol Evol, 37(5): 1530-1534.
-
QIAN J, SONG J, GAO H, et al. , 2013. The complete chloroplast genome sequence of the medicinal plant Salvia miltiorrhiza [J]. PLoS ONE, 8(2): e57607.
-
QIN YP, ZHANG XX, HE NT, et al. , 2023. Mechanism of anti-tumor effect of Saponin I of Schizocapsa plantaginea Hance on human pancreatic cancer cell PANC-1 transplanted in nude mice [J]. J Guangxi Med Univ, 40(6): 938-944. [秦燕萍, 张璇璇, 何能婷, 等, 2023. 裂果薯皂苷Ⅰ抗人胰腺癌细胞PANC-1裸鼠移植瘤的作用机制研究 [J]. 广西医科大学学报, 40(6): 938-944. ]
-
QUAX TE, CLAASSENS NJ, SÖLL D, et al. , 2015. Codon bias as a means to fine-tune gene expression [J]. Mol Cell, 59(2): 149-161.
-
ROMERO H, ZAVALA A, MUSTO H, 2000. Codon usage in Chlamydia trachomatis is the result of strand-specific mutational biases and a complex pattern of selective forces [J]. Nucl Acids Res, 28(10): 2084-2090.
-
SHI L, CHEN H, JIANG M, et al. , 2019. CPGAVAS2, an integrated plastome sequence annotator and analyzer [J]. Nucl Acids Res, 47(W1): W65-W73.
-
SUN YW, 2013. Targeted screening anti-cancer from herbal medicine in Guangxi and the isolation and anti-caner research of steroidal saponins from Schizocapsa plantaginea Hance [D]. Nanning: Guangxi Medical University. [孙悦文, 2013. 广西特色中草药靶向抗肿瘤筛选及裂果薯皂苷的分离与抗肿瘤作用研究 [D]. 南宁: 广西医科大学. ]
-
TOROKELDIEV N, ZIEHE M, GAILING O, et al. , 2019. Genetic diversity and structure of natural Juglans regia L. populations in the southern Kyrgyz Republic revealed by nuclear SSR and EST-SSR markers [J]. Tree Genet Genomes, 15(1): 501-512.
-
TULER AC, CARRIJO TT, NÖIA LR, et al. , 2015. SSR markers: a tool for species identification in Psidium (Myrtaceae) [J]. Mol Biol Rep, 42: 1501-1513.
-
WANG HM, WEI JF, QIU MM, et al. , 2004. Characteristics and microscopic identification of Tacca plantaginea Hance [J]. China Med Mat (10): 724-725. [王慧明, 韦家福, 丘明明, 等, 2004. 水田七的性状与显微鉴定 [J]. 中药材 (10): 724-725. ]
-
WANG J, WANG TY, WANG LY, et al. , 2019. Assembling and analysis of the whole chloroplast genome sequence of Elaeagnus angustifolia and its codon usage bias [J]. Acta Bot Boreal-Occident Sin, 39(9): 1559-1572. [王婧, 王天翼, 王罗云, 等, 2019. 沙枣叶绿体全基因组序列及其使用密码子偏性分析 [J]. 西北植物学报, 39(9): 1559-1572. ]
-
WICK RR, SCHULTZ MB, ZOBEL J, et al. , 2015. Bandage: interactive visualization of de novo genome assemblies [J]. Bioinformatics, 31(20): 3350-3352.
-
YANG C, WANG K, ZHANG H, et al. , 2023. Analysis of the chloroplast genome and phylogenetic evolution of three species of Syringa [J]. Mol Biol Rep, 50(1): 665-677.
-
Yunnan Medicinal Herbs Company, 1993. Directory of traditional Chinese medicinal resources in Yunnan Province [M]. Beijing: Science Press. [云南省药材公司, 1993. 云南中药资源名录 [M]. 北京: 科学出版社. ]
-
ZHANG L, LI HT, GAO LM, et al. , 2011. Phylogeny and evolution of bracts and bracteoles in Tacca (Dioscoreaceae) [J]. J Integr Plant Biol, 53(11): 901-911.
-
ZHAO P, WOESTE KE, 2011. DNA markers identify hybrids between butternut (Juglans cinerea L. ) and Japanese walnut (Juglans ailantifolia Carr. ) [J]. Tree Genet Genomes, 7: 511-533.
-
ZHOU M, LONG W, LI X, 2008. Patterns of synonymous codon usage bias in chloroplast genomes of seed plants [J]. For Stud China, 10: 235-242.
-
ZHU WZ, 2000. Flora of China: Vol. 24 [M]. Beijing: Science Press; St. Louis: Missouri Botanical Garden Press: 274-275.
-
摘要
蒟蒻薯属(Tacca)植物的分类一直存在很大的争议,其中广西裂果薯(Schizocapsa guangxiensis)被认为应与裂果薯(Tacca plantanginea)归并为同一物种,但也有学者根据其形态差异划分为不同的物种。为了明确广西裂果薯与裂果薯的遗传差异和系统发育关系,该研究对广西裂果薯进行DNA高通量测序,利用生物信息软件组装了完整的叶绿体基因组,并与已发表的裂果薯叶绿体基因组进行比较及系统发育分析。结果表明:(1)广西裂果薯和裂果薯的叶绿体基因组大小分别为162149 bp和160749 bp,GC含量都是36.90%,两者注释后得到的基因种类和基因数目完全一致,包含89个蛋白质编码基因、37个tRNA基因、6个rRNA基因。(2)密码子的偏好性分析显示,两物种使用的密码子频率存在一定差异,但是都偏好以A/T(U)结尾的密码子。(3)与裂果薯相比,广西裂果薯的SSC边界发生明显的扩张现象,是导致两者叶绿体基因组长度差异的主要因素。(4)广西裂果薯与裂果薯在LSC和SSC区域内存在一些序列分歧,尤其是基因间隔区,可用于开发物种特异性分子标记。(5)系统发育结果显示,广西裂果薯与裂果薯的亲缘关系较远,尽管广西裂果薯寄定在蒟蒻薯属内,但是它们属于两个不同的物种。该研究丰富了广西裂果薯叶绿体基因组遗传信息,为广西裂果薯物种分类、遗传多样性分析和物种保护提供了理论依据。
Abstract
The taxonomy of Tacca remains is controversial all the time. Schizocapsa guangxiensis is considered to be the same species as Tacca plantanginea, but some taxonomists classify them into different species based on their morphological differences. In order to clarify the genetic differences and phylogenetic relationship between Schizocapsa guangxiensis and Tacca plantanginea, this study conducted high-throughput DNA sequencing of Schizocapsa guangxiensis, assembled a complete chloroplast genome using bioinformatics software, and compared it with the published Tacca plantanginea chloroplast genome. The results were as follows: (1) The chloroplast genome size of Schizocapsa guangxiensis and Tacca plantanginea was 162149 bp and 160749 bp, respectively, and they had the same GC content (36.90%). Notably, the gene types and gene amount were exactly the same in these two species, including 89 protein-coding genes and 37 tRNA genes, and 6 rRNA genes. (2) Codon preference analysis showed that there were certain differences in the codon frequencies used by the two species, but they both prefered codons ending in A/T(U). (3) Compared with T. plantanginea, the SSC boundary of Schizocapsa guangxiensis had obvious expansion, which was the main factor leading to the length variant in chloroplast genome between the two species. (4) There were some sequence divergences between S. guangxiensis and Tacca plantanginea in the LSC and SSC regions, especially the intergenic region, which can be exploited as species-specific molecular marker. (5) Phylogenetic results showed that Schizocapsa guangxiensis and Tacca plantanginea had a rather distant genetic relationship. Although Schizocapsa guangxiensis was placed in Tacca, they belong to two different species. This study enriches the genetic information of the chloroplast genome of S. guangxiensis and provides a theoretical basis for species classification, genetic diversity analysis and species protection of S. guangxiensis.