Page 169 - 《广西植物》2023年第7期

P. 169

７期韩霜等: 藏茵陈基源植物皱边喉毛花的全长转录组信息分析１３３７

据库比对ꎬ筛选药用相关成分合成相关的代谢通行校正ꎬ生成校正序列( ｃｏｒｒｅｃｔｅｄｃｏｎｓｅｎｓｕｓ)ꎮ 利
路和转录本ꎮ 全长转录组能够为皱边喉毛花药用用ＣＤ￣ＨＩＴ软件( Ｆｕｅｔａｌ.ꎬ２０１２) 对校正后的转录
成分合成相关的关键基因的筛选提供重要的遗传本进行冗余分析ꎮ
资源ꎮ １.２.３全长转录组序列分析对去冗余后的序列进
行基因功能注释ꎬ所使用的数据库包括非冗余蛋白
１材料与方法数据库(Ｎｏｎ￣ＲｅｄｕｎｄａｎｔＰｒｏｔｅｉｎＤａｔａｂａｓｅꎬＮＲꎬ Ｄｅｎｇ

ｅｔａｌ.ꎬ２００６)、蛋白质家族域数据库(ＰｒｏｔｅｉｎＦａｍｉｌｉｅｓ
１.１试验材料ＤａｔａｂａｓｅꎬＰｆａｍꎬ Ｆｉｎｎｅｔａｌ.ꎬ２０１４)、蛋白质真核同源
新鲜幼叶采集于海南藏族自治州共和县(地理数据库(ＥｕｋａｒｙｏｔｉｃＯｒｔｈｏｌｏｇｏｕｓＧｒｏｕｐｓꎬＫＯＧꎬ Ｋｏｏｎｉｎ
坐标为１００°５３′５８. ４４″ Ｅ、３６° ２２′１９. ００″ Ｎꎬ海拔为ｅｔａｌ.ꎬ２００４)、蛋白质原核同源数据库 ( Ｃｌｕｓｔｅｒｏｆ
３５１８ｍ)ꎬ采集后迅速置于液氮罐中保存ꎬ后将其转ＯｒｔｈｏｌｏｇｏｕｓＧｒｏｕｐｓｏｆＰｒｏｔｅｉｎｓꎬＣＯＧꎬＴａｔｕｓｏｖｅｔａｌ.ꎬ

移至－８０ ℃ 的超低温冰箱中ꎬ用于后续ＲＮＡ提取ꎮ ２００３)、东京基因与基金组百科全书 ( Ｋｙｏｔｏ
凭证标本(Ｚｈａｎｇ２０１８０２６) 存放于中国科学院西北ＥｎｃｙｃｌｏｐｅｄｉａｏｆＧｅｎｅｓａｎｄＧｅｎｏｍｅｓꎬＫＥＧＧꎬＭｉｎｏｒｕｅｔ
高原生物研究所青藏高原生物标本馆(ＨＮＷＰ)ꎮ ａｌ.ꎬ２００４)、基因本体论数据库(ＧｅｎｅＯｎｔｏｌｏｇｙꎬＧＯꎬ
１.２方法Ａｓｈｂｕｒｎｅｒｅｔａｌ.ꎬ２０００)、核酸序列数据库(Ｎｕｃｌｅｏｔｉｄｅ
１.２. １ＲＮＡ提取和文库构建采用ＴｏｔａｌＲＮＡＳｅｑｕｅｎｃｅＤａｔａｂａｓｅꎬ ＮＴ ) 和ＳｗｉｓｓＰｒｏｔ数据库 ( ａ
Ｅｘｔｒａｃｔｏｒ( Ｔｒｉｚｏｌ) 试剂法( Ｃｏｎｎｏｌｌｙｅｔａｌ.ꎬ２００６) 提ｍａｎｕａｌｌｙａｎｎｏｔａｔｅｄａｎｄｒｅｖｉｅｗｅｄｐｒｏｔｅｉｎｓｅｑｕｅｎｃｅ
取皱边喉毛花的总ＲＮＡꎬ 琼脂糖凝胶电泳检测ｄａｔａｂａｓｅ)等ꎬ以此获得更全面的基因功能信息ꎮ
ＲＮＡ降解程度及污染情况ꎬ并评估其质量和完整１.２.４全长转录组结构分析利用ｉＴＡＫｖ１.７ａ软
性ꎮ 检测合格的ＲＮＡ样品用于构建皱边喉毛花件(参数设置:－ｆ３Ｆ) 对皱边喉毛花进行转录因子
全长转录组测序文库ꎮ 具体操作如下:在反转录 (ｔｒａｎｓｃｒｉｐｔｉｏｎｆａｃｔｏｒꎬＴＦ)预测( Ｚｈｅｎｇｅｔａｌ.ꎬ２０１６)ꎮ
酶的作用下ꎬ以ＯｌｉｇｏＤＴ为引物、目标ｍＲＮＡ为模利用ＭＩＳＡ( ＭＩｃｒｏＳＡｔｅｌｌｉｔｅＩｄｅｎｔｉｆｉｃａｔｉｏｎＴｏｏｌ) ｖ１.０
板ꎬ进行反转录ꎬ 通过低循环ＰＣＲ扩增全长软件检测简单重复序列标记 ( ｓｉｍｐｌｅｓｅｑｕｅｎｃｅ
ｃＤＮＡꎬ利用ＮＥＢＮｅｘｔＥｎｄｒｅｐａｉｒ / ｄＡ￣ｔａｉｌｉｎｇＭｏｄｕｌｅｒｅｐｅａｔｓꎬＳＳＲ)ꎬ设置单核苷酸、二核苷酸、三核苷
末端修读及加ｐｏｌｙ( Ａ) 尾ꎬＯＮＴＳＱＫＬＳＫ１０９试剂酸、四核苷酸、五核苷酸及六核苷酸的最少重复次
盒及ＮＥＢＮｅｘｔＱｕｉｃｋＬｉｇａｔｉｏｎｇＭｏｄｕｌｅ用于测序接数分别为１０、６、５、５、５、５ꎬ其余参数默认(Ｂｅｉｅｒｅｔ
头的连接ꎮ 建好的文库采用ＰｒｏｍｅｔｈＩＯＮ( Ｏｘｆｏｒｄａｌ.ꎬ ２０１７ )ꎮ 利用ＣＮＣＩｖ２ ( Ｃｏｄｉｎｇ￣Ｎｏｎ￣Ｃｏｄｉｎｇ
ＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓ公司ꎬ英国) 测序平台进行ＩｎｄｅｘꎬＳｕｎｅｔａｌ.ꎬ ２０１３)、ｐｌｅｋｖ１. ２ ( Ｐｒｅｄｉｃｔｏｒｏｆ
测序ꎮ ＬｏｎｇＮｏｎ￣ｃｏｄｉｎｇＲＮＡｓａｎｄｍＲＮＡｓＢａｓｅｄｏｎｋ￣ｍｅｒ
１.２.２数据处理测序完成后对原始数据进行过Ｓｃｈｅｍｅꎬ Ｌｉｅｔａｌ.ꎬ ２０１４ )、ＣＰＣ２ｖ０. １ ( Ｃｏｄｉｎｇ
滤ꎬ 去除接头以及低质量的ｒｅａｄｓꎮ 采用软件ＰｏｔｅｎｔｉａｌＣａｌｃｕｌａｔｏｒ２ꎬＫａｎｇｅｔａｌ.ꎬ２０１７) 软件以及
ＳＭＲＴｌｉｎｋｖ８. ０ ( ｈｔｔｐｓ: / / ｗｗｗ. ｐａｃｂ. ｃｏｍ / ｓｕｐｐｏｒｔ/ Ｐｆａｍ数据库(Ｆｉｎｎｅｔａｌ.ꎬ２０１４)对ＰａｃＢｉｏ测序数据
ｓｏｆｔｗａｒｅ￣ｄｏｗｎｌｏａｄｓ)进行过滤和处理ꎮ 参数设置: 进行编码潜能预测( 参数设为默认)ꎬ获得的长非
－ｍｉｎＬｅｎｇｔｈ５０( 最小长度为５０ｂｐ)ꎬ －ｍａｘＬｅｎｇｔｈ编码ＲＮＡ( ｌｏｎｇｎｏｎ￣ｃｏｄｉｎｇＲＮＡꎬＬｎｃＲＮＡ) 用于后
１５０００(最大长度为１５０００ｂｐ)ꎬ－ｍｉｎＰａｓｓｅｓ１( 最续分析ꎮ
小的ｆｕｌｌｐａｓｓ数为１)ꎮ 利用ｓｕｂｒｅａｄ.ｂａｍ文件得到

环形一致性序列 ( ｃｉｒｃｕｌａｒｃｏｎｓｉｓｔｅｎｃｙｓｅｑｕｅｎｃｅꎬ ２结果与分析
ＣＣＳ)ꎬ对其进行分类ꎬ搜寻并聚类ＦＬＮＣ序列ꎬ得
到ｃｏｎｓｅｎｓｕｓ序列ꎮ 利用Ａｒｒｏｗ软件对得到的２.１全长转录组测序及组装
ｃｏｎｓｅｎｓｕｓ序列进行校正ꎬ获得高质量的全长优化经ＳＭＲＴ ( Ｓｉｎｇｌｅ￣ＭｏｌｅｃｕｌｅＲｅａｌ￣Ｔｉｍｅ) 测序共
序列(ｐｏｌｉｓｈｅｄｃｏｎｓｅｎｓｕｓ)用于后续分析ꎬ最终统计获得１７Ｇｂ的原始数据ꎮ 对其过滤后获得
得到有效数据ꎮ 为提高数据的准确性ꎬ 利用１７３１５０６６个ｓｕｂｒｅａｄｓꎮ 基于ｓｕｂｒｅａｄ.ｂａｍ文件获
ＬｏＲＤＥＣ软件(Ｓａｌｍｅｌａ＆Ｒｉｖａｌｓꎬ２０１４)对转录本进得７９５６９８个ＣＣＳ序列ꎬＮ５０长度为２１４３ｂｐꎬ最

164 165 166 167 168 169 170 171 172 173 174