Page 208 - 《广西植物》2023年第5期
P. 208

5 期               颜成敏等: 基于叶绿体全基因组的云南樱花品种‘红霞’的种系分析                                           9 7 5

            策略ꎬ对 DNA 样品构建 1 个 350 bp 的文库ꎬ建好                    (https: / / www.ncbi.nlm.nih.gov / )ꎬ获得 Genbank 登
            的文 库 先 进 行 文 库 质 检ꎬ 质 检 合 格 的 文 库 用                录号:OP022428ꎮ
            Illumina NovaSeq 进行双末端测序ꎬ长度为 150 bpꎮ                   采用 MISA V 1.0(http:/ / pgrc.ipk ̄gatersleben.de/
                 高通量测序得到的原始图像数 据 文 件 经 碱                       misa/ misa.html/ )ꎬ使用默认参数对叶绿体进行 SSR
            基识别( base calling) 分析转化为 5.1G 的原始数                 检测ꎻ并且对应的各个重复单元( unit size) 最少重
            据( raw reads) ꎬ结果以 FASTQ 文件格式存储ꎮ 原                 复次数分别为 1-8、2-4、3-4、4-3、5-3、6-3ꎬ如1-
            始测序数据经过低质量数据过滤得到 5G 的有效                            8 表示以单核苷酸为重复单位时ꎬ其重复数至少为
            数 据 ( clean reads ) ꎮ 使 用 的 过 滤 软 件 为              8 才可被检测到ꎮ

            SOAPnuke V 1. 3. 0 ( https: / / github. com / BGI ̄     采 用 Geneious R10 ( Biomattersꎬ Ltd.ꎬ New
            flexlab / SOAPnuke) ꎬ过 滤 标 准 如 下: ( 1 ) 去 除 N      Zealand)软件从 NCBI 线上数据库下载樱属植物的
            碱基含量超过 5% 的数据( reads) ꎻ( 2) 去除低质                   叶绿体全基因组 15 个ꎬ分析“ 云南樱花” 品种‘ 红
            量( 质量值小于等于 5) 碱基数目达到 50% 的数                        霞’ 的系统位置和亲缘关系ꎮ 以 Malus prunifolia
            据( reads) ꎻ(3) 去除有接头( adapter) 污染的数据               (KU851961)(Lu et al.ꎬ 2003)为外类群ꎮ 所有 cp

            ( reads) ꎮ                                         基因组序列均在 Genious R10 中采用 MAFFT 进行
                                                               排列 ( align)ꎮ 最 后 在 RAxML V 8. 0 ( Stamatakisꎬ
                                                               2014)中根据最大似然标准构建系统发育树ꎬ并使
                                                               用 1 000 次 重 复 自 检 ( bootstrap) 计 算 各 分 支 支
                                                               持率ꎮ


                                                               2  结果与分析


                                                               2.1 ‘红霞’的叶绿体基因组
                                                                   通过组装ꎬ获得了完整的‘红霞’叶绿体全基因
                                                               组ꎬ其叶绿体全长为 157 832 bpꎬ包含一对反向重复
                                                               (inverted repeat sequenceꎬ IRꎬ26 381 bp)区ꎬ由小单
                                                               拷贝(short single copyꎬSSCꎬ19 120 bp) 区和大单拷
                                                               贝(long single copyꎬ LSCꎬ85 950 bp) 区间隔开来
                                                               (表 1 )ꎬ 基 因 组 的 鸟 嘌 呤 ( Guanine )、 胞 嘧 啶
                                                               (Cytosine)含量为 36.73%ꎮ ‘红霞’叶绿体基因组共
                       图 2  云南樱花品种‘红霞’
                                                               编码 128 个 基 因 ( 图 3)ꎬ 具 体 包 括 ATP 合 成 酶
            Fig. 2  Flowering cheery cultivar Cerasus ‘Hongxia’ in Yunnan
                                                               (atpA、 atpH、 atpE、 atpB、 atpI、 atpF)、 RNA 聚 合 酶
                                                               (rpoA、rpoC2、rpoC1、rpoB)、阅读框(ycf) (ycf4、ycf1、
                 使用 SPAdes V 3. 13. 0 ( https: / / github. com /  ycf2、 ycf3)、 转 移 RNA ( trnL ̄CAA、 trnR ̄ACG、 trnC ̄
            ablab / spades/ )软件进行基因组拼接ꎬ将拼接结果                   GCA、 trnW ̄CCA、 trnS ̄CGA、 trnD ̄GUC、 trnN ̄GUU、
            与近缘种高盆樱的叶绿体全基因组( MF621234)                         trnL ̄UAA、 trnK ̄UUU、 trnR ̄UCU、 trnY ̄GUA、 trnH ̄
            与给定的核酸序列与核酸数据库中的序列进行比                              GUG、 trnP ̄UGG、 trnS ̄GGA、 trnM ̄CAU、 trnT ̄UGU、
            对ꎬ基于比对情况并确定候选序列组装结果ꎮ 连                             trnA ̄UGC、 trnL ̄UAG、 trnV ̄GAC、 trnS ̄UGA、 trnE ̄
            接好 的 序 列ꎬ 若 包 含 gap ( 含 N 序 列)ꎬ 则 使 用              UUC、 trnT ̄GGU、 trnG ̄GCC、 trnQ ̄UUG、 trnF ̄GAA、
            Gapcloser(Version: 1.12)进一步补洞ꎬ得到最终的                trnS ̄GCU)、蛋白酶(clpP)、还原型辅酶Ⅰ(NADH)
            拼接结 果ꎮ 利 用 专 门 针 对 叶 绿 体 的 注 释 软 件                 脱氢酶(ndhJ、ndhK、ndhE、ndhC、ndhF、ndhH、ndhG、
            CPGAVAS2 V 2. 0 ( http: / / 47. 96. 249. 172:16019 /  ndhD、ndhI、ndhA、ndhB)、核糖体蛋白(LSU) (rpl2、
            analyzer / annotate / )进行基因注释后并绘图ꎮ 测序              rpl33、rpl23、rpl20、rpl22、rpl16、rpl14、rpl36、rpl32)、核
            后ꎬ使 用 Bankit 将 注 释 好 的 序 列 提 交 至 NCBI              糖体 RNA(rrn4.5S、rrn16S、rrn23S、rrn5S)、细胞色素
   203   204   205   206   207   208   209   210   211   212   213