Page 57 - 《广西植物》2020年第1期
P. 57
1 期 金鑫等: 基于 5 993 个核基因的被子植物系统发育关系研究 5 3
A. 每个同源基因家族含有的基因数目ꎻ B. 每个样品含有的同源基因家族数目ꎮ
A. Gene number of each orthologous gene familyꎻ B. Number of orthologous genes for each sample.
图 3 5 993 个聚类的同源基因家族
Fig. 3 Results of 5 993 inferred orthologous gene families
得最终 的 分 化 时 间 树ꎮ 拓 扑 结 构 的 枝 长 使 用 2017)ꎻArabidopsis thaliana 与 Populus trichocarpa 间
JONES+gamma 碱基替换模型获得ꎻrgene gamma 设 分化时间为 97 百万年至 109 百万年前( Kumar et
定为 G(1ꎬ 4.5)ꎻsigma2 gamma 设定为 G(1ꎬ 4.5)ꎻ al.ꎬ 2017)ꎻ豆目(Fabales)与壳斗目( Fagales) 间分
clock 设定为 3ꎻMarkov chain Monte Carlo( MCMC) 化时间为 93.5 百万年前( Friis et al.ꎬ 1996)ꎻ山茱
设定为 burnin = 50 000ꎬ sampfreq = 100ꎬ nsample = 萸目( Cornales) 共同祖先为 85.8 百万年前( Taka ̄
10 000ꎮ 对每个基因ꎬ都是分别运行两次独立的 hashi et al.ꎬ 2002)ꎻ唇形目( Lamiales) 共同祖先为
MCMC(即不同的 random seeds)ꎬ使用 Tracer v1.7 44.3 百万年前(Call et al.ꎬ 1992)ꎮ
软 件 ( https: / / github. com / beast - dev / tracer /
releases/ tag / v1.7.1 ) 观察运行结果是否稳定和收 2 结果与分析
敛ꎬ所有节点及参数的 effective sample size 是否大
于 200ꎮ 九个化石校准设定如下:银杏分化时间为 2.1 直系同源基因鉴定
290 百万年至 310 百万年前( Gao et al.ꎬ 1989)ꎻ单 我们对 44 个植物基因组基因集和 45 个已拼
子叶植物和真双子叶植物分化时间为 130 百万年 接转录 组 CDS 序 列 进 行 同 源 基 因 聚 类ꎬ 并 使 用
至 200 百万年前(Kumar et al.ꎬ 2017)ꎻ真双子叶植 Yang & Smith(2014)报道的方法ꎬ去除所有旁系同
物共同祖先( 即最早的双子叶植物化石记录) 为 源基因ꎬ最终获得大于 50 个样品的 one-to-one 基
125 百 万 年 前 ( Herendeenꎬ 1995ꎻ Zeng et al.ꎬ 因家族(即每个样品最多一条序列) 共5 993个( 图
2014)ꎻ山龙眼目( Proteales) 的共同祖先为 108.8 3:A)ꎬ 各 种 植 物 的 基 因 覆 盖 率 从 33. 57% 到
百万年前(Crane et al.ꎬ 1996)ꎻ葡萄目( Vitales) 与 97.85%ꎬ平均为 80.40%(图 3:B)ꎮ
其余蔷薇类植物间分化时间为 105 百万年至 115 2.2 系统发育进化树构建
百 万 年 前 ( Fawcett et al.ꎬ 2009ꎻ Kumar et al.ꎬ 我们采用串联和溯祖法共构建了 20 棵进化