Page 136 - 《广西植物》2022年第8期
P. 136
ऐ 期 牟少华等᧥ 四个竹秆变异毛竹变型的全基因组序列分析 ϟ ሕ ऐ ጢ
表 ϓই 四个毛竹变型样品简表 ऐ Ꭾᤃ ऐऐ࿗ ᤦᡱଫ花毛竹样品 ྉԡ࿗ɯ 的 ऊᔀᑕႿ ᔀᑕʛ༁
ఋᑕᤦᔀ ϟজ ାʢᔽᔀ ᔽႿᡷʢᆍʛࣼዹᡷᔽᆍႿ ᆍ ᆍࣼʢ 最多ᖔ为 ϟϟ ԡጢ࿗ Ꭾऐ ᤦᡱᤥ 定位到毛竹参考基因组
ᑕʢᔽᑕႿᡷ ༁ᑕቝᡱᔀ༁ ᆍ ᥘᆍ༁ᆍ ᤦᑕቝᤦᆍᆍ
的占所有 ऊᔀᑕႿ ᔀᑕʛ༁ 数的百分比在 ँँ࿗ጢᠮ以上ᖔ
形态特征 双端均定位到毛竹参考基因组上并且距离符合测
编号 变型 拉丁名
ᥘᆍʢᡱၤᆍᆍ੫ᔽዹᑕ
᧧᧕ ᑕʢᔽᑕႿᡷ ᓂᑕᡷᔽႿ Ⴟᑕቝᔀ 序片段的长度分布的占所有 ऊᔀᑕႿ ᔀᑕʛ༁ 数的百分
ዹၤᑕʢᑕዹᡷᔀʢᔽ༁ᡷᔽዹ༁
ԡϟ 黄皮毛竹 ۗ၊ᡥᤀᤀᅳᡙᐹዞ၊ᡥ ᓣʐࣩᤀᔠ 秆和枝金黄色 比在 ऐऐᠮ左右ᖔ说明参考基因组选择合适ᖔ且相关
၊ᅳᤀᅳዞ၊ʗᡥᐹ ऊࣼቝ༁ ᑕႿʛ ᤦʢᑕႿዹၤᔀ༁ 实验过程不存在污染ᖔ测序 ᔀᑕʛ༁ 的比对率会高于
੫ᆍʛᔀႿ ᢃᔀᆍऔ
Ꭾԡᠮᤥ 另外ᖔ比对率的 ࿗ 个毛竹变型与毛竹参考基
ԡ 金丝毛竹 ۗॹ ᓣʐࣩᤀᔠ ʗᐹዞᔠᤀᔠ 竹株小ᖔ秆壁较厚ᖔ基
部的节间较长 因组 亲缘关系较近ܦ 基 因 组组装质量高ᖔ 而且
̀ᔀᔽ੫ၤᡷ ༁ၤᆍʢᡷᖔ ዹࣼቝ औᑕ༁
ᡷၤᔽዹҴᖔ ᤦᑕ༁ᑕ ᔽႿᡷᔀʢႿᆍʛᔀ༁ ᔀᑕʛ༁ 测序质量高ᤥ࿗ 个样品平均覆盖深度均在
ᆍႿ੫ᔀʢ
ϟԡġ左右ྉ表 ɯᤥ
ԡሕ 绿皮花毛竹 ۗॹ ᓣʐࣩᤀᔠ 秆绿色ᖔ但节间有淡黄 ԣॹԣ ટۗ 的检测与注释
Ⴅᐹᤇᓣ၊ᔠቂᐹႥᐹ 色细纵条纹
ϟ ୩શ۪ 检测জ࿗ 个毛竹样品检测后获得 ୩શ۪ 位
ऊࣼቝ༁ ੫ʢᔀᔀႿᖔ ᔽႿᡷᔀʢႿᆍʛᔀ༁
औᔽᡷၤ ᔽ੫ၤᡷ ᢃᔀᆍऔ ༁ᡷʢᔽᡱ༁
点统计表ྉ表 ሕɯᤥ 其中ᖔ花毛竹样品ྉԡ࿗ɯ 的 ୩શ۪
ԡ࿗ 花毛竹 ۗॹ ᓣʐࣩᤀᔠ 秆黄色ᖔ有宽窄不等的
၊ࣩᐹቂᅳऊ၊ࣩ 绿色纵条纹 数量最多ᖔ为 ϟ ᤃँϟ Ꭾϟጢଫ绿皮花毛竹样品ྉԡሕɯ 的
ऊࣼቝ༁ ᢃᔀᆍऔ औᔽᡷၤ ੫ʢᔀᔀႿ
༁ᡷʢᔽᡱ༁ ୩શ۪ 数量最少ᖔ为 ϟ ጢሕ࿗ ᤃ࿗ऐᤥ ࿗ 个样品中ᖔ转换类型
ྉᡷʢᑕႿ༁ᔽᡷᔽᆍႿᖔ ఋᔽɯ ୩શ۪ 数量与颠换类型ྉᡷʢᑕႿ༁ᔀʢ༁ᔽᆍႿᖔ
ఋɯ ୩શ۪ 数量的比值 ఋᔽᣰ ఋ 在ሕԡጢ ጲ ሕϟԡ 之间ᖔ说
在 ᧧ࣼႿᔽቝᑕ ̀ᔽ༁ᔀी ጢԡԡ 测序平台上运行获得原始
明这些毛竹变型转换比颠换更容易发生ᤥ 杂合类
数据ᖔ将数据过滤后得到高质量数据ᤥ
型 ྉ ၤᔀᡷᔀʢᆍझᢃ੫ᆍ༁ᔽᡷᢃᖔ ̀ᔀᡷɯ ୩શ۪ 数量为纯合类型
ϟ 比对统计জ 使用 ାۼዶ 软件 ྉᓂᔽ ᪲ ᧕ࣼʢᤦᔽႿᖔ
ྉၤᆍቝᆍझᢃ੫ᆍ༁ᔽᡷᢃᖔ ̀ᆍቝᆍɯ ୩શ۪ 数量的 ϟԡ 倍左右ᖔ杂
ԡԡँɯ 将测序数据比对定位到已测序的毛竹基因
合比率为 ऐऐ ጢሕᠮ ጲ ँ ԡϟᠮᤥ 其中ᖔ花毛竹样品
组的位置ᖔ统计测序深度和基因组覆盖度等信息ᤥ ྉԡ࿗ɯ杂合比率最高ᖔ为 ँԡϟᠮᖔ说明其杂合程度
ϟ ሕ 检测 ୩શ۪ܓ ᧧Ⴟ᧕ᔀ 和 ୩ জ 使用 ۪ᔽዹᑕʢʛ 软件 最高ᤥ 绿皮花毛竹样品ྉԡሕɯ 杂合比率最低ᖔ为
ྉ᥈ᆍʢʛᆍႿ ᔀᡷ ᑕᖔ ԡϟ ɯ 去重复和 ᥈ዶఋ 软件
ऐऐጢሕᠮᤥ
ྉᥘዹҴᔀႿႿᑕ ᔀᡷ ᑕᖔ ԡϟԡɯ 预处理后ᖔ 检测 ୩શ۪ 和
根据 ࿗ 个毛竹样品与参考基因组的比对结果ᖔ
᧧Ⴟ᧕ᔀ 变异ᤥ 使用 ାʢᔀᑕҴ᧕ᑕႿዹᔀʢ 软件 ྉऊၤᔀႿ ᔀᡷ ᑕᖔ 汇总样品间 ୩શ۪ 的统计结果见表 ࿗ᖔ表中各数值为
ԡԡँɯ 检测 ୩ 变异ᖔ 具体方法参照牟少华等 对应的横纵两样品之间的 ୩શ۪ 数ᤥ 从表中可以看
ྉԡԡɯᤥ 出ᖔ金丝毛竹ྉԡɯ与绿皮花毛竹样品ྉԡሕɯ 间的
ϟ ࿗ 注释 ୩શ۪ܓ ᧧Ⴟ᧕ᔀ 和 ୩ জ 运用 ୩Ⴟᡱጶ 软件 ୩શ۪ 数最多ᤥ
ྉऊᔽႿ੫ᆍᑕႿᔽ ᔀᡷ ᑕᖔ ԡϟɯ 注释 ୩શ۪ܦ᧧Ⴟ᧕ᔀ 和 ୩ᖔ具 ୩શ۪ 注释জ 对 ࿗ 个样品 ୩શ۪ 进行注释ᖔ获得
体方法参照牟少华等ྉԡԡɯᤥ 其变异位点发生的区域或类型ྉ图 ϟɯᤥ ࿗ 个毛竹变
ϟጢ 注释功能基因জ 运用 ାᓂዶ୩ఋ 软件ᖔ对筛选得 型发生在编码区ྉ ዹᆍʛᔽႿ੫ ༁ᔀीࣼᔀႿዹᔀᖔऊ᧕୩ɯ 区域内的
到 的功能可能变 异基因的基因序列与 ᥈ᨃ ୩શ۪ 数量占比均为 ᠮ左右ᖔ其中同义突变占 ࿗ऐᠮ
ྉ ዶ༁ၤᤦࣼʢႿᔀʢ ᔀᡷ ᑕᖔ ԡԡԡ ɯܦ ऊᨃ᥈ ྉ ఋᑕᡷࣼ༁ᆍ ᔀᡷ ᑕᖔ 左右ᖔ非同义突变占 ጢϟᠮ左右ᤥ 非同义突变率与同
ԡԡԡɯ和 ጶ᥈᥈ ྉ ᥘᔽႿᆍʢࣼ ᔀᡷ ᑕᖔ ԡԡ࿗ɯ 三大功能数 义突变率的比值大于 ϟᖔ预示着有正向选择效应ᤥ
据库ᖔ进行 ାᓂዶ୩ఋ 比对ᖔ得到基因注释ᤥ ԣॹᇺ ᧇႥᦵᓣᤀ 检测与注释
ሕϟ ᧧Ⴟ᧕ᔀ 检测জ 对 ࿗ 个毛竹变型 ᧧Ⴟ᧕ᔀ 进行统
জ 结果与分析 计ྉ表 ጢɯᖔ可以发现 ࿗ 个样品全基因组范围检测出
的 ᧧Ⴟ᧕ᔀ 总数范围为 Ꭾϟ ᤃ࿗ऐ ጲ ँ ጢሕᖔ其中插入
ԣॹϓ 与毛竹基因组比对 类型的突变总数略低于缺失突变总数ଫ编码区检
࿗ 个竹种通过高通量测序得到测序数据ᤥ 金 测出的 ᧧Ⴟ᧕ᔀ 总数为 ࿗ Ꭾϟϟ ጲ ࿗ ऐᎮᎮᖔ其中插入突变
丝毛竹样品ྉԡɯ 过滤后的 ऊᔀᑕႿ ᔀᑕʛ༁ 最少ᖔ为 总数为缺失突变的 ᤃᎮᠮ左右ᤥ 各样品中ᖔ全基因