Page 137 - 《广西植物》2021年第11期
P. 137
ϟϟ 期 李江莹等᧥ 印度血桐与中平树基因组调查及 ୩୩ 分子标记分析 ϟ ऐ ँ ँ
结果的野生植株ᖔ于 ԡϟँ 年 Ꭾ 月采自西双版纳傣 ϓॹᣤ ቴ 分析
族自治州景洪市勐龙镇勐宋村公路边ᖔ带回实验 采 用 微卫星识别工具 ྉ ቝᔽዹʢᆍ༁ᑕᡷᔀᔽᡷᔀ ᔽʛᔀႿᡷᔽ᥋
室ᖔ液氮速冻后放置于 ͱ ऐԡ ቩ 超低温冰箱保存ᖔ ᔽዹᑕᡷᔽᆍႿ ᡷᆍᆍᖔ ᥘ᧧୩ዶ ɯ ྉ ၤᡷᡷᡱ᧥ᣰ ᣰ ᡱ੫ʢዹ ᧧ᡱҴ᥋੫ᑕᡷᔀʢ༁ᔀᤦᔀႿ
备用ᤥ ʛᔀ ᣰ ቝᔽ༁ᑕ ᣰ ɯ在所有序列中搜索 ୩୩ 位点ᖔ搜索参数如
ϓॹԣ 样品基因组 ᦵટዛ 的提取ܓ检测与测序 下᧥ቝᆍႿᆍ᥋ϟԡܦʛᔽ᥋ᤃܦᡷʢᔽ᥋ጢܦఋᔀᡷʢᑕ᥋ጢܦᡱᔀႿᡷᑕ᥋ጢܦၤᔀᑕ᥋ᤃᤥ 其
采用 ऊఋዶା 法提取印度血桐与中平树叶片基 中ᖔ复合序列中两个不同 ୩୩ 之间允许的最大间隔
因组 ᧕શዶᖔ紫外分光光度计检测样品浓度ᖔ琼脂糖 设置为 ϟԡԡ ᤦᡱ ྉ张璟璇等ᖔԡϟँɯᤥ
凝胶电泳检测完整性ଫ将提取的 ᧕શዶ 样品送至公
司进行建库测序ᖔ参考其他木本植物的基因组大 জ 结果与分析
小及大戟科植物的 ऊ 值范围ᖔ选取 ϟ᥈ᤦ 左右的基
因组大小来评估印度血桐与中平树的基因组测序 ԣॹϓ 材料的 ᦵટዛ 提取
覆盖度ᤥ 采用 ऊఋዶା 法提取印度血桐与中平树幼嫩叶
ϓॹᇺ 建库信息及数据量统计 片的基因组 ᧕શዶᤥ 电泳图显示提取的两种材料基
印度血桐与中平树基因 组采用二代测序技 因组 ᧕શዶ 质量良好 ྉ 图 ϟɯᤥ 其中ᖔ 印度血桐的
术ᖔ利用 ۼ᥈୩ ྉ 全基因组鸟枪法ɯᖔ分别构建插入 ᧕શዶ 浓度为 ϟጢ࿗ Ⴟ੫ኼဂᓂ ᖔ中平树的 ᧕શዶ 浓度
᥋ϟ
᥋ϟ
片段为 ሕጢԡ 和 ጢԡԡ ᤦᡱ 的 ᧕શዶ 文库ᖔ再用 ᧧ࣼቝᔽႿᑕ 为 ϟԡ࿗ᤃ Ⴟ੫ኼဂᓂ ᖔ可用于后续实验分析ᤥ
̀ᔽ༁ᔀी ԡԡԡ 平台进行双末端ྉ۪ᑕᔽʢ᥋ጶႿʛɯ 测序ᖔ最
ఋᥘ
终得到原始测序数据ྉ ʢᑕऔ ʢᔀᑕʛ༁ɯᖔ取全部原始数
据对测序结果进行图像识别ᖔ去污染ᖔ去接头ଫ统
计结果包括测序 ʢᔀᑕʛ 数量ܦ数据产量ܦ测序错误
率ܦ͐ԡܦ͐ሕԡܦ᥈ऊ 含量等ᤥ
ϓॹ 基因组大小预测和杂合度估计
将本实验通过测序得到的序列ᖔ基于 ᥋ቝᔀʢ 的
分析方法估计印度血桐与中平树的基因组大小及
杂合率ᖔ取 ᢉ ϟᎮ 进行分析ᤥ᥋ቝᔀʢ 分布图用来判
断基因组的重复序列多少ᖔ如果材料的基因组重
复比例较高ᖔ᥋ቝᔀʢ 分布图右侧将会出现拖尾现
象ᤥቝᔀʢ 深度分布服从泊松分布ᖔ根据曲线获得
标准 品ଫ ᤹ ͦ ϓ ఋʢᑕႿ༁ Ҵ ᡱࣼ༁ଫ ᤹ ͦ ԣఋʢᑕႿ༁ ϟጢҴ ᡱࣼ༁ଫ
᥋ቝᔀʢ 深度期望值ᖔ用于估计基因组大小ྉ周媛等ᖔ
ϓ 印度血桐 ᧕શዶ 提取结果ଫ ԣ 中平树 ᧕શዶ 提取结果ᤥ
ԡϟँɯᤥ 另外ᖔ在 ᥋ቝᔀʢ 的分布曲线中ᖔ一般会出 ୩ᑕቝᡱᔀଫ ᤹ͦϓ ఋʢᑕႿ༁ Ҵ ᡱࣼ༁ଫ ᤹ͦԣఋʢᑕႿ༁ ϟጢҴ ᡱࣼ༁ଫ ϓ᧕શዶ
现一个覆盖度最高的主峰ᖔ若在主峰两侧出现另 ᔀᡷʢᑕዹᡷᔽᆍႿ ʢᔀ༁ࣼᡷ༁ ᆍ ᤹ᐹዞᐹʗᐹႥᐹ ᔠႥʐᔠዞᐹଫ ԣ ᧕શዶ ᔀᡷʢᑕዹᡷᔽᆍႿ ʢᔀ༁ࣼᡷ༁
一个小峰ᖔ则说明该材料的基因组有较高的杂合 ᆍ ᤹ॹ ʐᓣႥᡙᔠዞࣩᤀᐹᡙᐹ
图 ϟজ 实验材料 ᧕શዶ 提取结果
度ଫ反之ᖔ则没有ᤥ
ϓॹጇ 样品污染判断 èᔽ੫ ϟজ ᧕શዶ ᔀᡷʢᑕዹᡷᔽᆍႿ ʢᔀ༁ࣼᡷ༁ ᆍ ᔀᡱᔀʢᔽቝᔀႿᡷᑕ ቝᑕᡷᔀʢᔽᑕ༁
在基因组研究中ᖔ样品是否存在污染问题至关
重要ᤥ 若数据未被污染ᖔ可保证实验样品基因组序 ԣॹԣ 测序数据产量统计
列的完整性ᖔ数据真实有效ᖔ结果可靠ଫ若数据被污 利用 ᧧ࣼቝᔽႿᑕ 平台对两种材料进行高通量双
染ᖔ则无法获得相关信息ᤥ 对过滤后的高质量数据 端测序ᖔ经过对原始测序数据的严格筛选ᖔ得到高
质量的产出数据ྉ ዹᔀᑕႿ ʛᑕᡷᑕɯᖔ以下统计是印度血
随机抽取 ϟԡ ԡԡԡ 条 ʢᔀᑕʛ༁ྉ ʢᔀᑕʛϟ 和 ʢᔀᑕʛ 各ጢԡԡԡ
条ɯ数据ᖔ通过 ାᓂዶ୩ఋ 软件比对 શऊା᧧ 核苷酸数据 桐与中平树 ࿗ 个文库的产出数据ྉ 表 ϟɯᤥ 统计结
库ྉશఋ 库ɯᖔ若比对结果是同源比对ᖔ则认为样本不 果包括测序数据数量ܦ 数据产量ܦ 错误率ܦ͐ԡܦ
存在外源污染ଫ若比对结果出现亲缘关系较远的物 ͐ሕԡܦ᥈ऊ 含量等ᤥ 过滤掉低质量的数据后ᖔ分别得
到了 ጢሕጢᤃ 和 ᤃऐԡᎮ ᥈ᤦ 的印度血桐与中平树的数
种ᖔ说明样品可能存在污染ྉ闫婧ᖔԡϟऐɯᤥ