Page 156 - 《广西植物》2023年第10期
P. 156
1 9 1 0 广 西 植 物 43 卷
植物序列ꎬ并以 1 条鹿蹄草属( Pyrola Linn.) 植物 基因组编码的基因从 123 个 [马缨杜鹃(原变种)]
序列和 1 条喜冬草属(Chimaphila Pursh)植物序列 至 150 个(朱红大杜鹃) 不等ꎬ蛋白编码基因 80 个
为外 类 群ꎮ 将 以 上 17 条 叶 绿 体 全 基 因 组 导 入 [马缨杜鹃(原变种)] ~ 95 个(朱红大杜鹃)ꎬtRNA
MAFFT v.7 软件( Katoh & Standleyꎬ 2013) 中进行 基因 35 个 [马缨杜鹃(原变种)] ~47 个(朱红大杜
比对ꎬ比 对 的 结 果 在 ModelFinder 软 件 ( Rozas et 鹃)ꎬrRNA 基因均为 8 个(表 1)ꎬ引起差异的主要
al.ꎬ 2017)中计算最佳拟合的核苷酸替代模型和 原因是 ycf1、ycf15、trnR ̄UCU、trnM ̄CAU、trnH ̄GUG、
相 应 参 数ꎮ 分 别 以 最 大 似 然 法 ( maximum accD、infA 等基因在部分物种中缺失(表 2)ꎮ
likelihoodꎬ ML) 和 贝 叶 斯 法 ( Bayesian inferenceꎬ 2.2 简单重复序列分析
BI)进行系统发育分析ꎮ ML 树在 RAxML v8.2.4 通过对头花杜鹃和陇蜀杜鹃叶绿体基因组序
软 件 ( Stamatakisꎬ 2014 ) 中 构 建ꎬ 参 数 设 置 为 列进行 MISA 分析ꎬ共检测出 263 个简单重复序
Models = GTR + GAMMAꎬbootstrap = 1 000ꎻBI 树 列ꎬ6 种类型( 单核苷酸 SSR、二核苷酸 SSR、三核
在 MrBayes v3.2.6 软件( Huelsenbeck & Ronquistꎬ 苷酸 SSR、四核苷酸 SSR、五核苷酸 SSR 和六核苷
2001) 中 构 建ꎬ 参 数 设 置 为 Models = GTR + 酸 SSR)ꎮ 在头花杜鹃中检测到 130 个 SSRꎬ其
GAMMAꎬ Generations = 2 000 000ꎬ Sampling 中ꎬ74 个 SSR 分布在 LSCꎬ2 个 SSR 分布在 SSC
Freq = 1 000ꎬBurnin Fraction = 0.25ꎮ 区ꎬ两个 IRs 共分布 54 个 SSRꎬ最丰富的类型是单
核苷 酸 SSR ( 86 个)ꎬ 其 次 是 二 核 苷 酸 SSR ( 19
2 结果与分析 个)、三核 苷 酸 SSR ( 12 个)、 四 核 苷 酸 SSR ( 12
个)、六 核 苷 酸 SSR ( 1 个)ꎬ 未 检 测 到 五 核 苷 酸
2.1 叶绿体基因组基本特征 SSRꎮ 在陇蜀杜鹃杜鹃中共检测到 133 个 SSRꎬ有
头花杜鹃与陇蜀杜鹃叶绿体基因组序列均为 87 个 SSR 分布在 LSC 区ꎬ 3 个 SSR 分布在 SSC
环式双链分子ꎬ呈经典的四段式结构ꎬ包括一个大 区ꎬ两个 IRs 区共分布 43 个 SSRꎬ其中包括 71 个
单拷贝区(LSC)、一个小单拷贝区(SSC) 以及两个 单核苷酸 SSR、19 个二核苷酸 SSR、25 个三核苷
反向重复区( IRs) ( 图 1)ꎮ 头花杜鹃叶绿体基因 酸 SSR、16 个四核苷酸 SSRꎬ五核苷酸 SSR 和六核
组( GenBank 登 录 号: OL804295 ) 全 长 ( Full) 为 苷酸 SSR 各一个(表 3)ꎮ
200 257 bpꎬLSC 区、SSC 区以及两个 IRs 区长度分 2.3 密码子使用偏好性分析
别为 105 990、2 617、45 825 bpꎻ陇蜀杜鹃叶绿体基 为了进行 9 种杜鹃属植物叶绿体基因组的密
因组( GenBank 登录号:OL871190) 全长( Full) 为 码子使用偏好性分析ꎬ共筛选出 436 条符合条件
206 829 bpꎬLSC 区、SSC 区以及两个 IRs 区长度分 的蛋白编码基因序列ꎬ其中头花杜鹃 47 条、陇蜀
别为 109 191、2 606、47 516 bpꎮ 头花杜鹃和陇蜀 杜鹃 49 条、秀雅杜鹃 49 条、马缨杜鹃( 原变种)
杜鹃的叶绿体基因组总 GC 含量分别为 35.8%和 44 条、朱红大杜鹃 54 条、灵宝杜鹃 49 条、照山白
35.7%ꎬIRs 区的 GC 含量(36.6%、36.5%) 均高于 50 条、羊踯躅 49 条和阔柄杜鹃 45 条ꎮ 通过对杜
LSC 区 ( 为 35. 4%、 35. 1%) 及 SSC 区 ( 29. 8%、 鹃属植物叶绿体基因组密码子使用偏好性分析ꎬ
30.0%)ꎮ 9 个杜鹃花属植物的叶绿体基因组长度 由图 2 可知ꎬ在大部分杜鹃属植物叶绿体基因组
范围为 193 798 ~ 208 015 bpꎬ其中最大的是灵宝 中ꎬRSCU > 1 的 高 频 密 码 子 共 有 30 个 ( AGA、
杜鹃ꎬ最小的是马缨杜鹃(原变种)ꎻLSC 区长度范 UAA、GCU 等)ꎬ其中 29 个以 A / U 碱基结尾ꎬ而以
围为105 990 ~ 110 593 bpꎬSSC 区长度范围为 26 ~ G / C 结尾的仅 1 个ꎬ表明杜鹃属植物叶绿体密码
2 621 bpꎬIRs 区长度范围为 40 583 ~ 47 516 bpꎻ总 子偏爱于以 A / U 结尾ꎻRSCU<1 的密码子共有 32
GC 含量为 35.7% ~ 36.0%ꎬ差异不大(表 1)ꎮ 个(AGC、CGC、UGA 等)ꎬ以 G / C 结尾的有 29 个ꎬ
头花杜鹃叶绿体基因组编码 138 个基因ꎬ包括 以 A / U 结尾的有 3 个ꎮ 而头花杜鹃、照山白和羊
86 个蛋白编码基因(PCG)、44 个 tRNA 基因及 8 个 踯躅 叶 绿 体 基 因 组 中ꎬ 除 UGA 被 偏 好 使 用 外
rRNA 基因ꎻ陇蜀杜鹃叶绿体基因组则编码 143 个 (RSCU>1)ꎬ其余密码子的偏好性均一致ꎮ 以上结
基因ꎬ 包括 89 个 PCG、46 个 tRNA 基 因 及 8 个 果分析表明ꎬ9 个杜鹃属物种之间密码子的偏好性
rRNA 基因ꎮ 目前已发表的 9 种杜鹃属植物叶绿体 保持高度的一致ꎮ