Page 141 - 《广西植物》2023年第10期
P. 141
10 期 施晓静等: 基于全叶绿体基因组分析的栽培黄草乌基源研究 1 8 9 5
生物医药科技有限公司进行 DNA 文库构建ꎬ并采 头属植物中的系统发育位置ꎬ从美国国家生物信
用 Illumina HiSeq 4000 高通量测序平台进行测序ꎮ 息中心(NCBI)下载了 32 个已发表的乌头属叶绿
1.3 叶绿体基因组组装、注释和物理图谱绘制 体 基 因 组 序 列ꎬ 此 外 还 选 择 1 种 飞 燕 草 属
测序获得的原始数据( raw data) 用软件 NGS (Consolida)植物 C. orientalis(NC_047292)ꎬ1 种翠
QC Toolkit( Patel & Jainꎬ 2012) 进行过滤ꎬ使用默 雀属 ( Delphinium) 植 物 还 亮 草 [ D. anthriscifolium
认参数ꎬ除去低质量的 reads 后获得待组装序列 (MK253461)]作为外类群ꎬ用以构建系统进化树
( clean reads )ꎮ 参 考 乌 头 属 黄 草 乌 A. (表 2)ꎮ 采 用 MAFFT v. 7. 0 进 行 全 序 列 比 对
vilmorinianum(NC_038094) 的叶绿体基因组序列ꎬ (Katoh & Standleyꎬ 2013)ꎬ同时选择最大似然法
利用 NOVOPlasty(Dierckxsens et al.ꎬ 2017)软件对 (maximum likelihoodꎬ ML) 和 贝 叶 斯 法 ( Bayesian
10 个栽培品的 clean reads 进行 de novo 组装ꎬk ̄mer inferenceꎬ BI)进行系统发育分析以增加结果的可
值设置为 39ꎮ 采用在线注释软件 Annotation Tool 信度ꎬML 树在软件 Phylosuite( Zhang et al.ꎬ 2020)
GeSeq ( Tillich et al.ꎬ 2017 ) 进 行 注 释ꎬ 并 在 中进行构建ꎬ自展值设置为 1 000 次ꎬBI 树同样使
Geneious R11.1.5 软件( Kearse et al.ꎬ 2012) 中进 用 Phylosuite 软件进行构建ꎬ共运算 2 000 000 代ꎬ
行 人 工 校 对ꎮ 将 叶 绿 体 基 因 组 序 列 导 入 根据 马 尔 科 夫 链 的 蒙 特 卡 洛 模 拟 算 法 ( Markov
OGDRAW ̄Draw(Greiner et al.ꎬ 2019)在线工具ꎬ绘 chain Monte CarloꎬMCMC)ꎬ以随机树作为起始树ꎬ
制叶绿体基因组物理图谱ꎬ带有完整注释信息的 每运算 1 000 代抽样一次ꎮ 舍弃 burn ̄in 阶段 25%
cpDNA 序列上传于 GenBank 数据库中ꎬ并获得相 的老化样本ꎬ并且在平均标准差降低至 0.01 以下
应 的 登 录 号 ( DC ̄2 ̄2ꎬ OP227195ꎻ GJ ̄1 ̄3ꎬ 时ꎬ用剩余的样本构建多数一致树ꎮ
OP227196ꎻ JS ̄1 ̄4ꎬ OP227197ꎻ LJ ̄1 ̄2ꎬ OP227198ꎻ
LJ ̄3 ̄2ꎬ OP227199ꎻ LJ ̄4 ̄3ꎬ OP227200ꎻ LQ ̄1 ̄3ꎬ 2 结果与分析
OP227201ꎻLX ̄1 ̄3ꎬOP227202ꎻNL ̄1 ̄3ꎬOP227203ꎻ
QJ ̄1 ̄2ꎬOP227204)ꎮ 2.1 叶绿体全基因组基本结构特征和分类
1.4 全叶绿体基因组特征分析 与大多数被子植物的叶绿体基因组结构相类
使用在线工具 MISA( Beier et al.ꎬ 2017) 对各 似ꎬ10 个栽培品叶绿体基因组全长 155 744 bp(LJ ̄
序列的简单重复序列(SSR)进行检测ꎬ参数设置为 1 ̄2) ~ 155 937 bp( DC ̄2 ̄2) ( 图 1)ꎬ呈典型的四分
单核 苷 酸 ( mono ̄nucleotide) SSR ≥ 10ꎬ 二 核 苷 酸 体环状结构ꎬ即一对反向重复区( inverted repeatꎬ
(di ̄nucleotide) SSR ≥5ꎬ 三 核 苷 酸 ( tri ̄nucleotide) IR)将整个环状的叶绿体基因组分为一个大单拷
SSR≥4ꎬ四核苷酸( tetra ̄nucleotide) SSR≥3ꎬ五核 贝区(large single copy regionꎬ LSC) 和一个小单拷
苷酸(penta ̄nucleotide) SSR≥3 和六核苷酸( hexa ̄ 贝区( small single copy regionꎬ SSC)ꎬ其大小分别
nucleotide)SSR≥3ꎮ 为26 170 ~ 26 236 bp、85 453 ~ 86 548 bp、16 921 ~
1.5 全叶绿体基因组比较分析 17 007 bpꎬ10 个样品的叶绿体基因组十分保守ꎬ不
使 用 IRscope 在 线 工 具 ( Amiryousefi et al.ꎬ 仅大小和结构相似ꎬ而且 GC 含量均为38.1%ꎬ都
2018)对 10 个栽培品叶绿体基因组 4 个区域边界 具有明显的 AT 偏向性ꎮ 此外ꎬ叶绿体基因组注释
进 行 差 异 分 析ꎮ 以 黄 草 乌 为 参 考 序 列ꎬ 使 用 结果(表 3) 显示ꎬ10 个样品叶绿体基因组内容和
mVISTA ( Frazer et al.ꎬ 2004 ) 在 线 工 具ꎬ 采 用 顺序基本一致ꎬ均含有 131 个基因ꎬ其中包括蛋白
shuffle ̄LAGAN 模式进行乌头属叶绿体基因组全序 质编码基因 85 个、转运 RNA 基因( tRNA)37 个和
列比对ꎮ 采用 DnaSP ( Rozas et al.ꎬ 2017) 软件测 核糖体 RNA 基因(rRNA)8 个ꎮ
定 10 个 栽 培 品 叶 绿 体 基 因 组 的 核 苷 酸 多 样 性 10 个栽培品的基因根据各功能的不同可以分
(nucleotide diversityꎬ Pi)ꎬ参数如下:每步滑行 200 为 4 大类:(1)与转录翻译相关的基因ꎻ(2)与光合
bp ( step = 200 bp )ꎬ 窗 口 长 度 600 bp ( window 作用相关的基因ꎻ(3) 其他基因ꎻ(4) 未知功能基
length = 600 bp)ꎮ 因ꎮ 与转录翻译相关的基因包括核糖体蛋白亚基
1.6 系统发育分析 基因、RNA 聚合酶基因、rRNA 基因和 tRNA 基因ꎬ
为探讨 10 个栽培品之间的进化关系以及在乌 其中 tRNA 基因数量最多ꎻ与光合作用相关的基因