Page 141 - 《广西植物》2023年第10期
P. 141

10 期                 施晓静等: 基于全叶绿体基因组分析的栽培黄草乌基源研究                                          1 8 9 5

            生物医药科技有限公司进行 DNA 文库构建ꎬ并采                           头属植物中的系统发育位置ꎬ从美国国家生物信
            用 Illumina HiSeq 4000 高通量测序平台进行测序ꎮ                 息中心(NCBI)下载了 32 个已发表的乌头属叶绿
            1.3 叶绿体基因组组装、注释和物理图谱绘制                             体 基 因 组 序 列ꎬ 此 外 还 选 择 1 种 飞 燕 草 属

                 测序获得的原始数据( raw data) 用软件 NGS                  (Consolida)植物 C. orientalis(NC_047292)ꎬ1 种翠
            QC Toolkit( Patel & Jainꎬ 2012) 进行过滤ꎬ使用默           雀属 ( Delphinium) 植 物 还 亮 草 [ D. anthriscifolium
            认参数ꎬ除去低质量的 reads 后获得待组装序列                          (MK253461)]作为外类群ꎬ用以构建系统进化树
            ( clean reads )ꎮ 参 考 乌 头 属 黄 草 乌 A.                (表 2)ꎮ 采 用 MAFFT v. 7. 0 进 行 全 序 列 比 对

            vilmorinianum(NC_038094) 的叶绿体基因组序列ꎬ                (Katoh & Standleyꎬ 2013)ꎬ同时选择最大似然法
            利用 NOVOPlasty(Dierckxsens et al.ꎬ 2017)软件对         (maximum likelihoodꎬ ML) 和 贝 叶 斯 法 ( Bayesian

            10 个栽培品的 clean reads 进行 de novo 组装ꎬk ̄mer           inferenceꎬ BI)进行系统发育分析以增加结果的可
            值设置为 39ꎮ 采用在线注释软件 Annotation Tool                  信度ꎬML 树在软件 Phylosuite( Zhang et al.ꎬ 2020)
            GeSeq ( Tillich et al.ꎬ 2017 ) 进 行 注 释ꎬ 并 在        中进行构建ꎬ自展值设置为 1 000 次ꎬBI 树同样使
            Geneious R11.1.5 软件( Kearse et al.ꎬ 2012) 中进       用 Phylosuite 软件进行构建ꎬ共运算 2 000 000 代ꎬ
            行 人 工 校 对ꎮ 将 叶 绿 体 基 因 组 序 列 导 入                   根据 马 尔 科 夫 链 的 蒙 特 卡 洛 模 拟 算 法 ( Markov
            OGDRAW ̄Draw(Greiner et al.ꎬ 2019)在线工具ꎬ绘            chain Monte CarloꎬMCMC)ꎬ以随机树作为起始树ꎬ
            制叶绿体基因组物理图谱ꎬ带有完整注释信息的                              每运算 1 000 代抽样一次ꎮ 舍弃 burn ̄in 阶段 25%
            cpDNA 序列上传于 GenBank 数据库中ꎬ并获得相                      的老化样本ꎬ并且在平均标准差降低至 0.01 以下
            应 的 登 录 号 ( DC ̄2 ̄2ꎬ OP227195ꎻ GJ ̄1 ̄3ꎬ              时ꎬ用剩余的样本构建多数一致树ꎮ
            OP227196ꎻ JS ̄1 ̄4ꎬ OP227197ꎻ LJ ̄1 ̄2ꎬ OP227198ꎻ
            LJ ̄3 ̄2ꎬ OP227199ꎻ LJ ̄4 ̄3ꎬ OP227200ꎻ LQ ̄1 ̄3ꎬ        2  结果与分析
            OP227201ꎻLX ̄1 ̄3ꎬOP227202ꎻNL ̄1 ̄3ꎬOP227203ꎻ
            QJ ̄1 ̄2ꎬOP227204)ꎮ                                  2.1 叶绿体全基因组基本结构特征和分类
            1.4 全叶绿体基因组特征分析                                        与大多数被子植物的叶绿体基因组结构相类
                 使用在线工具 MISA( Beier et al.ꎬ 2017) 对各           似ꎬ10 个栽培品叶绿体基因组全长 155 744 bp(LJ ̄
            序列的简单重复序列(SSR)进行检测ꎬ参数设置为                           1 ̄2) ~ 155 937 bp( DC ̄2 ̄2) ( 图 1)ꎬ呈典型的四分
            单核 苷 酸 ( mono ̄nucleotide) SSR ≥ 10ꎬ 二 核 苷 酸        体环状结构ꎬ即一对反向重复区( inverted repeatꎬ
            (di ̄nucleotide) SSR ≥5ꎬ 三 核 苷 酸 ( tri ̄nucleotide)  IR)将整个环状的叶绿体基因组分为一个大单拷
            SSR≥4ꎬ四核苷酸( tetra ̄nucleotide) SSR≥3ꎬ五核             贝区(large single copy regionꎬ LSC) 和一个小单拷
            苷酸(penta ̄nucleotide) SSR≥3 和六核苷酸( hexa ̄            贝区( small single copy regionꎬ SSC)ꎬ其大小分别
            nucleotide)SSR≥3ꎮ                                  为26 170 ~ 26 236 bp、85 453 ~ 86 548 bp、16 921 ~
            1.5 全叶绿体基因组比较分析                                    17 007 bpꎬ10 个样品的叶绿体基因组十分保守ꎬ不

                 使 用 IRscope 在 线 工 具 ( Amiryousefi et al.ꎬ     仅大小和结构相似ꎬ而且 GC 含量均为38.1%ꎬ都
            2018)对 10 个栽培品叶绿体基因组 4 个区域边界                       具有明显的 AT 偏向性ꎮ 此外ꎬ叶绿体基因组注释
            进 行 差 异 分 析ꎮ 以 黄 草 乌 为 参 考 序 列ꎬ 使 用                结果(表 3) 显示ꎬ10 个样品叶绿体基因组内容和
            mVISTA ( Frazer et al.ꎬ 2004 ) 在 线 工 具ꎬ 采 用        顺序基本一致ꎬ均含有 131 个基因ꎬ其中包括蛋白
            shuffle ̄LAGAN 模式进行乌头属叶绿体基因组全序                      质编码基因 85 个、转运 RNA 基因( tRNA)37 个和
            列比对ꎮ 采用 DnaSP ( Rozas et al.ꎬ 2017) 软件测            核糖体 RNA 基因(rRNA)8 个ꎮ
            定 10 个 栽 培 品 叶 绿 体 基 因 组 的 核 苷 酸 多 样 性                 10 个栽培品的基因根据各功能的不同可以分

            (nucleotide diversityꎬ Pi)ꎬ参数如下:每步滑行 200           为 4 大类:(1)与转录翻译相关的基因ꎻ(2)与光合
            bp ( step = 200 bp )ꎬ 窗 口 长 度 600 bp ( window      作用相关的基因ꎻ(3) 其他基因ꎻ(4) 未知功能基
            length = 600 bp)ꎮ                                  因ꎮ 与转录翻译相关的基因包括核糖体蛋白亚基
            1.6 系统发育分析                                         基因、RNA 聚合酶基因、rRNA 基因和 tRNA 基因ꎬ
                 为探讨 10 个栽培品之间的进化关系以及在乌                        其中 tRNA 基因数量最多ꎻ与光合作用相关的基因
   136   137   138   139   140   141   142   143   144   145   146