Page 170 - 《广西植物》2023年第7期
P. 170
1 3 3 8 广 西 植 物 43 卷
大长度为 16 860 bpꎬ最小长度为 60 bpꎬ平均长度 39 214条ꎬ注释到 KOG 数据库的转录本最少ꎬ有
为2 337 bp(表 1)ꎮ 经分类获得 695 698 条 FLNC 26 396条(图 2)ꎮ 26 722、39 102 条转录本分别注
序列ꎬN50 长 度 为 2 055 bpꎬ 最 大 长 度 为 12 952 释到 GO 数据库和 KEGG 数据库中ꎮ 39 592 条转
bpꎬ最小长度为 52 bpꎮ 对其聚类后获得 87 814 条 录本注释到至少一个数据库中ꎬ16 273 条转录本
consensus 序列ꎬ最大长度为 8 269 bpꎬ最小长度为 注释到所有数据库中ꎮ 从不同数据库中选择 5 个
338 bpꎬN50 长度为2 219 bpꎮ 对 consensus 序列进 常用的数据库进行韦恩图绘制(图 3)ꎮ
行校正后ꎬ获得87 814 条校正 序 列ꎬN50 长 度 为
2 221 bpꎮ 我们对冗余前后的序列长度频数分布
情况进行了统计(图 1)ꎮ
表 1 SMRT 测序数据统计
Table 1 Statistics of sequencing data by SMRT
最小 最大 平均
总数 长度 长度 长度 N50 长度
类别 N50
Total Min Max Mean
Category length
account length length length
(bp)
(bp) (bp) (bp)
Subread 17 315 066 — — 1 620 1 505
环形一致
795 698 60 16 860 2 337 2 143
性序列 CCS
FLNC 695 698 52 12 952 1 774 2 055
优化序列
图 2 转录本注释结果
Polished 87 814 338 8 269 2 233 2 219
sequence
Fig. 2 Annotation results of transcripts
校正序列
Corrected 87 814 338 8 269 2 233 2 221
sequence
图 1 皱边喉毛花全长转录组 Transcripts
和 Unigenes 长度分布图
Fig. 1 Full ̄length transcriptome of distribution of
Transcripts and Unigenes for Comastoma polycladum
图 3 转录本功能注释韦恩图
Fig. 3 Venn diagram of function annotated transcripts
2.2 全长转录组功能注释
共有 277 451 条转录本成功注释到 7 个数据 2.2. 1 KOG 注 释 与 KOG 数据库比对后ꎬ 共有
库中ꎬ其 中 注 释 到 NR 数 据 库 的 转 录 本 最 多ꎬ 有 29 531 条基因被注释成功ꎮ 按 KOG 分类可分为 26