Page 208 - 《广西植物》2023年第5期
P. 208
5 期 颜成敏等: 基于叶绿体全基因组的云南樱花品种‘红霞’的种系分析 9 7 5
策略ꎬ对 DNA 样品构建 1 个 350 bp 的文库ꎬ建好 (https: / / www.ncbi.nlm.nih.gov / )ꎬ获得 Genbank 登
的文 库 先 进 行 文 库 质 检ꎬ 质 检 合 格 的 文 库 用 录号:OP022428ꎮ
Illumina NovaSeq 进行双末端测序ꎬ长度为 150 bpꎮ 采用 MISA V 1.0(http:/ / pgrc.ipk ̄gatersleben.de/
高通量测序得到的原始图像数 据 文 件 经 碱 misa/ misa.html/ )ꎬ使用默认参数对叶绿体进行 SSR
基识别( base calling) 分析转化为 5.1G 的原始数 检测ꎻ并且对应的各个重复单元( unit size) 最少重
据( raw reads) ꎬ结果以 FASTQ 文件格式存储ꎮ 原 复次数分别为 1-8、2-4、3-4、4-3、5-3、6-3ꎬ如1-
始测序数据经过低质量数据过滤得到 5G 的有效 8 表示以单核苷酸为重复单位时ꎬ其重复数至少为
数 据 ( clean reads ) ꎮ 使 用 的 过 滤 软 件 为 8 才可被检测到ꎮ
SOAPnuke V 1. 3. 0 ( https: / / github. com / BGI ̄ 采 用 Geneious R10 ( Biomattersꎬ Ltd.ꎬ New
flexlab / SOAPnuke) ꎬ过 滤 标 准 如 下: ( 1 ) 去 除 N Zealand)软件从 NCBI 线上数据库下载樱属植物的
碱基含量超过 5% 的数据( reads) ꎻ( 2) 去除低质 叶绿体全基因组 15 个ꎬ分析“ 云南樱花” 品种‘ 红
量( 质量值小于等于 5) 碱基数目达到 50% 的数 霞’ 的系统位置和亲缘关系ꎮ 以 Malus prunifolia
据( reads) ꎻ(3) 去除有接头( adapter) 污染的数据 (KU851961)(Lu et al.ꎬ 2003)为外类群ꎮ 所有 cp
( reads) ꎮ 基因组序列均在 Genious R10 中采用 MAFFT 进行
排列 ( align)ꎮ 最 后 在 RAxML V 8. 0 ( Stamatakisꎬ
2014)中根据最大似然标准构建系统发育树ꎬ并使
用 1 000 次 重 复 自 检 ( bootstrap) 计 算 各 分 支 支
持率ꎮ
2 结果与分析
2.1 ‘红霞’的叶绿体基因组
通过组装ꎬ获得了完整的‘红霞’叶绿体全基因
组ꎬ其叶绿体全长为 157 832 bpꎬ包含一对反向重复
(inverted repeat sequenceꎬ IRꎬ26 381 bp)区ꎬ由小单
拷贝(short single copyꎬSSCꎬ19 120 bp) 区和大单拷
贝(long single copyꎬ LSCꎬ85 950 bp) 区间隔开来
(表 1 )ꎬ 基 因 组 的 鸟 嘌 呤 ( Guanine )、 胞 嘧 啶
(Cytosine)含量为 36.73%ꎮ ‘红霞’叶绿体基因组共
图 2 云南樱花品种‘红霞’
编码 128 个 基 因 ( 图 3)ꎬ 具 体 包 括 ATP 合 成 酶
Fig. 2 Flowering cheery cultivar Cerasus ‘Hongxia’ in Yunnan
(atpA、 atpH、 atpE、 atpB、 atpI、 atpF)、 RNA 聚 合 酶
(rpoA、rpoC2、rpoC1、rpoB)、阅读框(ycf) (ycf4、ycf1、
使用 SPAdes V 3. 13. 0 ( https: / / github. com / ycf2、 ycf3)、 转 移 RNA ( trnL ̄CAA、 trnR ̄ACG、 trnC ̄
ablab / spades/ )软件进行基因组拼接ꎬ将拼接结果 GCA、 trnW ̄CCA、 trnS ̄CGA、 trnD ̄GUC、 trnN ̄GUU、
与近缘种高盆樱的叶绿体全基因组( MF621234) trnL ̄UAA、 trnK ̄UUU、 trnR ̄UCU、 trnY ̄GUA、 trnH ̄
与给定的核酸序列与核酸数据库中的序列进行比 GUG、 trnP ̄UGG、 trnS ̄GGA、 trnM ̄CAU、 trnT ̄UGU、
对ꎬ基于比对情况并确定候选序列组装结果ꎮ 连 trnA ̄UGC、 trnL ̄UAG、 trnV ̄GAC、 trnS ̄UGA、 trnE ̄
接好 的 序 列ꎬ 若 包 含 gap ( 含 N 序 列)ꎬ 则 使 用 UUC、 trnT ̄GGU、 trnG ̄GCC、 trnQ ̄UUG、 trnF ̄GAA、
Gapcloser(Version: 1.12)进一步补洞ꎬ得到最终的 trnS ̄GCU)、蛋白酶(clpP)、还原型辅酶Ⅰ(NADH)
拼接结 果ꎮ 利 用 专 门 针 对 叶 绿 体 的 注 释 软 件 脱氢酶(ndhJ、ndhK、ndhE、ndhC、ndhF、ndhH、ndhG、
CPGAVAS2 V 2. 0 ( http: / / 47. 96. 249. 172:16019 / ndhD、ndhI、ndhA、ndhB)、核糖体蛋白(LSU) (rpl2、
analyzer / annotate / )进行基因注释后并绘图ꎮ 测序 rpl33、rpl23、rpl20、rpl22、rpl16、rpl14、rpl36、rpl32)、核
后ꎬ使 用 Bankit 将 注 释 好 的 序 列 提 交 至 NCBI 糖体 RNA(rrn4.5S、rrn16S、rrn23S、rrn5S)、细胞色素