Page 170 - 《广西植物》2023年第7期
P. 170

1 3 3 8                                广  西  植  物                                         43 卷
            大长度为 16 860 bpꎬ最小长度为 60 bpꎬ平均长度                    39 214条ꎬ注释到 KOG 数据库的转录本最少ꎬ有
            为2 337 bp(表 1)ꎮ 经分类获得 695 698 条 FLNC               26 396条(图 2)ꎮ 26 722、39 102 条转录本分别注
            序列ꎬN50 长 度 为 2 055 bpꎬ 最 大 长 度 为 12 952            释到 GO 数据库和 KEGG 数据库中ꎮ 39 592 条转
            bpꎬ最小长度为 52 bpꎮ 对其聚类后获得 87 814 条                   录本注释到至少一个数据库中ꎬ16 273 条转录本
            consensus 序列ꎬ最大长度为 8 269 bpꎬ最小长度为                  注释到所有数据库中ꎮ 从不同数据库中选择 5 个
            338 bpꎬN50 长度为2 219 bpꎮ 对 consensus 序列进            常用的数据库进行韦恩图绘制(图 3)ꎮ
            行校正后ꎬ获得87 814 条校正 序 列ꎬN50 长 度 为
            2 221 bpꎮ 我们对冗余前后的序列长度频数分布

            情况进行了统计(图 1)ꎮ

                       表 1  SMRT 测序数据统计
                Table 1  Statistics of sequencing data by SMRT
                               最小     最大      平均
                        总数     长度     长度      长度   N50 长度
               类别                                    N50
                        Total  Min     Max    Mean
              Category                               length
                       account  length  length  length
                                                     (bp)
                               (bp)   (bp)   (bp)
              Subread  17 315 066  —   —     1 620   1 505
              环形一致
                      795 698   60    16 860  2 337  2 143
             性序列 CCS
               FLNC   695 698   52    12 952  1 774  2 055
              优化序列
                                                                            图 2  转录本注释结果
              Polished  87 814  338   8 269  2 233   2 219
              sequence
                                                                      Fig. 2  Annotation results of transcripts
              校正序列
              Corrected  87 814  338  8 269  2 233   2 221
              sequence





















                 图 1  皱边喉毛花全长转录组 Transcripts
                         和 Unigenes 长度分布图
                Fig. 1  Full ̄length transcriptome of distribution of
               Transcripts and Unigenes for Comastoma polycladum
                                                                        图 3  转录本功能注释韦恩图
                                                                Fig. 3  Venn diagram of function annotated transcripts
            2.2 全长转录组功能注释
                 共有 277 451 条转录本成功注释到 7 个数据                    2.2. 1 KOG 注 释   与 KOG 数据库比对后ꎬ 共有
            库中ꎬ其 中 注 释 到 NR 数 据 库 的 转 录 本 最 多ꎬ 有               29 531 条基因被注释成功ꎮ 按 KOG 分类可分为 26
   165   166   167   168   169   170   171   172   173   174   175