Page 168 - 《广西植物》2023年第7期
P. 168

1 3 3 6                                广  西  植  物                                         43 卷
                 and 87 814 high ̄quality full ̄length transcripts were obtained by clustering and de ̄redundancy of 795 698 circular
                 consistency sequences (CCSs) sequences. (2) Comparing with seven databasesꎬ 277 451 transcripts were annotated
                 successfullyꎬ and in NR database with 39 214 transcripts annotated the most transcripts. A total of 26 396 transcripts
                 were annotated to the KOG databaseꎬ with 26 subcategoriesꎬ and a total of 39 104 transcripts with six major pathways
                 and 40 secondary pathways to the KEGG database. A total of 39 102 transcripts were annotated to the GO databaseꎬ
                 which were divided into three major categories: molecular functionꎬ biological process and cellular component. (3) SSR
                 analysis yielded 22 861 SSRsꎬ with single ̄base repeats being the most abundant. A total of 1 874 transcription factors and
                 15 166 long non ̄coding RNAs ( LncRNAs) were identifiedꎬ and the C3H transcription factor family had the most
                 annotated transcripts. (4) A total of 55 transcripts involved in the synthesis of monoterpenes and flavonoids were
                 screened out. These results enrich the transcriptome information of C. polycladumꎬ and provide significant genetic
                 resources for further screening of candidate genes related to the synthesis of medicinal components of C. polycladum.
                 Key words: Comastoma polycladumꎬ full ̄length transcriptomeꎬ metabolic pathwayꎬ transcription factorꎬ LncRNA




                藏茵陈是青藏高原藏药八珍之一ꎬ龙胆科植                            RNA 样品提取与检测、建库及测序等环节的工作ꎬ
            物是藏茵陈入药源植物中的主要植物ꎬ多以川西                              最终得到高质量的全长转录本信息( 王瑞娴和李
            獐牙菜、湿生扁蕾、椭圆叶花锚和喉毛花属植物入                             川ꎬ2019ꎻ张子敬等ꎬ2020)ꎮ 对没有参考基因组的
            药ꎬ常用于热症、肝胆病及血液病等疾病的治疗                              植物而言ꎬ全长转录组( full ̄length transcriptome) 测
            (唐丽等ꎬ2007)ꎮ 近年来的研究表明ꎬ这些基源植                         序为其研究提供了可能ꎬ解决了转录本拼接较短、
            物包含丰富的药用成分ꎬ主要为环烯醚萜、黄酮类                             信息不完整的难题(赵陆滟等ꎬ2019)ꎮ 因此ꎬ三代
            化合物ꎬ在保肝、抗氧化、抗病毒等方面具有显著                             测序技术成为深入挖掘基因组数据的有效手段之
            效果(延 玺 等ꎬ2008ꎻ董 天 骄 等ꎬ2011ꎻ杨 青 松 等ꎬ                一(赵陆滟等ꎬ2019)ꎮ 近年来ꎬ有许多学者研究了
            2013 )ꎮ 龙 胆 科 ( Gentianaceae ) 喉 毛 花 属             青藏高原地区药用植物的全长转录组ꎮ 在这些研
            (Comastoma)植物是藏茵陈基源植物之一( 钟国跃                       究案例中ꎬ对老芒麦( Elymus sibiricus) 的转录组解
            等ꎬ2010)ꎬ对喉毛花属植物的研究目前主要集中                           析成功并挖掘到其落粒相关候选基因ꎬ为筛选低
            在细胞学、胚胎学、生态学、系统发育研究及天然                             落粒老芒麦新品种提供了参考( 张俊超ꎬ2020)ꎮ
            产物学上(刘建全和何廷农ꎬ1996ꎻ张婵等ꎬ2014ꎻ                        丹参(Salvia miltiorrhiza)的全长转录组揭示了丹参
            刘 小 翠 等ꎬ 2016ꎻ Zhang et al.ꎬ 2021ꎻ 刘 真 等ꎬ          酮二萜类化合物的生物合成的相关 基 因 ( Xu et
            2021)ꎮ 刘真等(2021) 在长梗喉毛花的化学成分                       al.ꎬ 2015 )ꎮ 蒙 古 黄 芪 ( Astragalus membranaceus
            研究中发现 25 个化合物ꎬ其抗炎活性较高并对人                           var. mongholicus)全长转录组解析了次生代谢产物
            体癌细胞株具有抑制作用ꎮ 乔涌起等(2012) 在长                         生物合成的相关基因( Li et al.ꎬ2017)ꎮ 这些研究
            梗喉毛花植物中分离得到正丁醇化学成分ꎬ为进                              案例说明全长转录组对药用植物关键基因的挖掘
            一步深入研究其化学成分奠定基础ꎮ 然而ꎬ有关                             具有显著优势ꎬ为进一步研究药用植物的功能基
            喉毛花属植物的基因注释信息尚未见报道ꎬ限制                              因提供了新的思路和参考ꎮ
            了对次级代谢产物合成相关代谢通路及功能基因                                  喉 毛 花 属 的 皱 边 喉 毛 花 ( Comastoma
            的研究ꎮ 因此ꎬ需要利用测序技术丰富喉毛花植                             polycladum)为青藏高原特有植物(Ho & Liuꎬ2001ꎬ
            物的转录组遗传信息ꎮ                                         2015)ꎮ 目前对皱边喉毛花的研究主要集中在系
                 随着测序技术的发展ꎬ越来越多的学者将高                           统发育研究上ꎮ 为进一步了解喉毛花属下物种植
            通量测序技术应用到植物转录 组 研 究 ( Wang et                      物体内的次级代谢产物ꎬ应对相关转录组进行深
            al.ꎬ2016ꎻZhu et al.ꎬ2017ꎻ朱兴正等ꎬ2018)ꎮ 二代            入研究ꎬ本研究以皱边喉毛花为对象ꎬ基于 PacBio
            测序读长的限制导致所拼接得到的转录本不够完                              测序平台对其全长转录组进行测序ꎬ获取的数据
            整ꎬ而三代测序技术正好弥补了这一缺点ꎬ其能够                             用于功能注释、可变剪切分析、SSR 分析、转录因
            完成长读长测序ꎬ测序过程无需打断ꎬ严格执行                              子分析及长非编码 RNA 等分析ꎮ 通过与公共数
   163   164   165   166   167   168   169   170   171   172   173