Page 75 - 《广西植物》2023年第8期
P. 75
8 期 吴欣仪等: 基于简化基因组测序揭示水角的濒危机制 1 4 1 7
程序得到包含75 209个 SNPs 位点的 vcf 文件ꎮ 为 “raster”和“rgdal”提取每个种群点的气候信息ꎬ构
保证下游分析的可靠性ꎬ使用 VCFtools v0.1.13 软 建 19 个环境因子的环境距离矩阵ꎬ用“ geosphere”
件(Danecek et al.ꎬ 2011) 对 Stacks 软件中检测出 构建地理距离的矩阵ꎬ利用“ ape” 读取遗传距离矩
的 SNPs 进一步过滤ꎮ 设置--max-missing 0.9ꎬ即 阵ꎬ用“ade4”对两两矩阵进行9 999次的 Mantel 重
最大缺失率为 90%ꎻ--maf 0.05ꎬ将最小等位基因 复检验ꎬ利用“ ggplot” 进行 Mantel 检验结果的绘
频率设置为 0.05ꎻ--minDP 5ꎬ确保基因型最小深 图ꎮ 此 外ꎬ 利 用 Arlequin 3. 5 软 件 ( Excoffier &
度为 5ꎮ 过滤后剩下高质量的 38 667 个 SNPs 用 Lischerꎬ 2010 ) 进 行 分 子 方 差 分 析 ( analysis of
于后续群体遗传结构的分析ꎮ molecular varianceꎬ AMOVA)ꎮ AMOVA 基于进化
1.4 群体结构分析 距离( evolutionary distance) 来度量并计算单倍型
基 于 34 个 水 角 样 品 的 SNPs 位 点ꎬ 运 行 (含等位基因) 或基因型间的方差( δ2)ꎬ计算组间
vcf2phylip 脚本构建个体间的遗传距离矩阵ꎬ利用 遗传分化系数(genetic differentiation among groupsꎬ
IQ_TREE v1.6.9 软件(Nguyen et al.ꎬ 2015)使用最 F )ꎬ推断群体不同遗传组分之间的变异水平ꎮ
CT
大似然法(maximum likelihoodꎬ ML) 进行系统树的 1.7 种群历史动态分析
构建ꎮ 根 据 1 000 次 重 复 的 快 速 自 展 ( ultrafast 基于 SMC 模拟种群历史动态的方法是高度依
bootstrapꎬ UFBoot)(Minh et al.ꎬ 2013) 和 SH ̄aLRT 赖于完整基因组上的重组图谱ꎬ并不适用于无参
(Guindon et al.ꎬ 2010)测试进化枝ꎬ得到最终的系 考基因组的物种( Li & Durbinꎬ 2011)ꎮ 而基于点
统发 育 树ꎮ 利 用 FigTree v1. 4. 3 软 件 ( http: / / 位频谱(site frequency spectumꎬSFS) 的方法不依赖
tree.bio. ed. ac. uk / software / figtree / ) 可 视 化 和 编 辑 于位 点 之 间 的 连 锁 或 连 续 性 ( Gutenkunst et al.ꎬ
生成的树文件ꎮ 2009)ꎬ并且对近期的种群历史大小变化有较高的
将之 前 获 得 的 高 质 量 的 SNP 数 据 集 使 用 分辨率( Liu & Fuꎬ 2015ꎻ Lapierre et al.ꎬ 2017)ꎮ
VCFtools 软件转换成 ped 和 map 文件后进行过滤 因此ꎬ 将 所 获 得 的 SNP 数 据 使 用 基 于 SFS 的
生 成 bed 文 件ꎬ 用 Admixture ( Alexander et al.ꎬ Stairway Plot v2( Liu & Fuꎬ 2020) 推测水角在 100
2009)基于每个个体的基因型推断个体祖先成分ꎬ kya~ 1 kya( thousand years ago) 间的 Ne 变化ꎮ 生
模拟在亚群数 K 值为 2 到 7 情况下的分群情况ꎬ 成无缺失且无连锁不平衡( linkage disequilibriumꎬ
根据 不 同 K 值 模 拟 下 的 最 小 交 叉 验 证 ( cross LD) 的 SNP 数 据 集ꎬ 将 VCF 文 件 用 python 脚 本
validationꎬ CV)获得最佳分群数ꎮ easySFS(https: / / github.com / isaacovercast/ easySFS)
使用 GCTA v1. 26. 0 软 件 ( https: / / yanglab. 建立一维( one ̄dimensionalꎬ 1D) SFSꎮ 将 SFS 状态
westlake.edu. cn / software / gcta / ) 生 成 用 于 PCA 分 指定为 foldedꎬ以统计次等位基因的 SFSꎮ 选择使
析的矩阵ꎬ用 R 语言中的 ggplot2 软件包绘制主成 位点 数 尽 量 多 的 projection 值 输 出 SFS 信 息ꎬ 将
分分析的结果图ꎮ SFS 信息输入 Stairway Plot v2 运行所需的 blueprint
1.5 群体遗传多样性分析 文件中ꎮ 突变率设置为 1.0×10 ꎬ2 年为一代ꎬ200
 ̄8
通过 Stacks 软件中的 Populations 子程序计算物 次自展检验用于计算 Ne 中位数及 95%置信区间ꎮ
种水平的近交系数(inbreeding coefficientꎬF )ꎬ观察 结果在 R 语言中可视化ꎮ
IS
杂合度 ( observed heterozygosityꎬ H )ꎬ期望杂合度 1.8 潜在分布区预测
o
(expected heterozygosityꎬ H )ꎮ 同时基于所有(变异 根据材料采集ꎬ分布点通过 GPS 实地定位以
e
和非 变 异) 位 点 计 算 核 苷 酸 多 态 性 ( nucleotide 及中国数字植物标本馆( http: / / www.cvh.org.cn / )
diversityꎬ π ) 等 遗 传 参 数ꎮ 再 用 R 语 言 的 和全球 生 物 多 样 性 信 息 网 络 ( https: / / www. gbif.
GroupGenome v2.6.1 程序包(Pfeifer et al.ꎬ 2014)计 org / )等相关数据库获取标本采集地经纬度信息ꎬ
算种群间遗传分化系数(genetic differentiation among 共收集到东南亚水角坐标信息 200 余个ꎮ 对所有
populationsꎬ F )ꎬ衡量群体间遗传分化水平ꎮ 数 据 按 照 MaxEnt 模 型 ( http: / / biodiversity
ST
1.6 Mantel 相关性检验和分子方差分析 informatics.amnh. org / open _ source / maxent) 要 求 进
为了评估 7 个水角种群的遗传距离、地理距离 行标准化处理ꎬ 并且为了防止在进行最大熵模型
以及环 境 距 离 之 间 的 相 关 性ꎬ 利 用 R 软 件 中 的 分析时出现过拟合现象ꎬ将水角的分布数据进行