Page 147 - 《广西植物》2021年第11期
P. 147
ϟϟ 期 付 春 等 ᧥ 中粒咖啡 ۩ቴᣞɔ 基因家族的生物信息学分析 ϟ ँ ԡ ँ
表 ԣই 中粒咖啡 ۩ቴᣞɔ 转录因子亲疏水性预测 ԣॹᣤ 编码蛋白的二级ܓ三级结构预测分析
ఋᑕᤦᔀ জ ۪ʢᔀʛᔽዹᡷᔽᆍႿ ᆍ ၤᢃʛʢᆍᡱၤᔽᔽዹᔽᡷᢃ ᑕႿʛ ၤᢃʛʢᆍᡱၤᆍᤦᔽዹᔽᡷᢃ 蛋白质的二级结构主要是指蛋白质的多肽链
ᆍ ۩ቴᣞɔ ᡷʢᑕႿ༁ዹʢᔽᡱᡷᔽᆍႿ ᑕዹᡷᆍʢ༁ ᔽႿ ࣷᅳஏஏᓣᐹ ዞᐹႥᓣᡓ၊ᅳʗᐹ 中有规则重复的构象ᖔ从 ࣷዞ۩ቴᣞɔ 家族成员的蛋白
二级结构分析可以看出ᖔࣷዞ۩ቴᣞɔ 基因家族的二级
最大疏水性 最小疏水性
总平均 结构主要由无规则卷曲ܦም᥋螺旋ܦᏇ᥋转角和延伸链组
疏水指数 ᥘᑕᔽቝࣼቝ ᥘᔽႿᔽቝࣼቝ
蛋白名称 ၤᢃʛʢᆍᡱၤᆍᤦᔽዹᔽᡷᢃ ၤᢃʛʢᆍᡱၤᆍᤦᔽዹᔽᡷᢃ
ఋᆍᡷᑕ ᑕᔀʢᑕ੫ᔀ 成ᖔ这 ࿗ 种蛋白质的二级结构元件通常为主要研究
۪ʢᆍᡷᔀᔽႿ Ⴟᑕቝᔀ
ၤᢃʛʢᆍᡱၤᆍᤦᔽዹ 位置 数值 位置 数值
ᔽႿʛᔀ 对象ྉ张春兰等ᖔԡϟऐɯᖔ通过预测和数据分析更易
۪ᆍ༁ᔽᡷᔽᆍႿ ᑕࣼᔀ ۪ᆍ༁ᔽᡷᔽᆍႿ ᑕࣼᔀ
了解蛋白的空间结构ᤥ 其中ᖔ无规则卷曲所占比例
ऊዹԡԡᡸ੫ԡᤃऐሕԡ ͱԡऐँँ ጢ ጢ࿗࿗ ࿗࿗ ͱँऐँ
较高ᖔ介于 ࿗ጢᎮሕᠮ ጲ ᎮᎮᤃᠮ之间ᖔ其主要功能为连
ऊዹԡԡᡸ੫ϟሕऐँԡ ͱԡऐ࿗ऐ ऐᎮ ϟऐጢᤃ ሕጢԡ ͱሕ࿗ԡԡ
接其他二级结构元件ᖔᏇ᥋转角在二级结构中占比均
ऊዹԡԡᡸ੫ϟጢᤃԡ ͱԡᤃᎮऐ ࿗ሕጢ Ꭾऐ ँ࿗ ͱሕጢᤃ
ऊዹԡϟᡸ੫ϟऐᎮሕԡ ͱԡँँ ϟऐᖔϟँ ϟᤃऐँ ऐᖔँ ͱሕԡԡ 较小ᤥ ࣷዞ۩ቴᣞɔ 基因家族的 二级结构较整齐ᖔ 除
ऊዹԡϟᡸ੫ϟ࿗ँጢԡ ͱԡᎮጢँ ऐᤃ ϟऐऐँ ϟϟ ͱሕሕ࿗࿗
ऊዹԡԡᡸ ੫ԡᤃऐሕԡܦ ऊዹԡጢ ᡸ ੫ϟ࿗ᤃᤃԡܦ ऊዹԡᎮ ᡸ ੫ϟᤃ࿗ԡԡܦ ऊዹԡऐ ᡸ
ऊዹԡᡸ੫ԡϟऐᤃԡ ͱԡጢᎮँ ሕ࿗ϟ ϟሕ࿗࿗ ϟϟᤃ ͱऐሕሕ
੫ϟϟԡᤃԡ 和 ऊዹϟԡᡸ੫ԡᤃ࿗ԡԡ 是无规则卷曲ᢦ延伸链ᢦም᥋
ऊዹԡᡸ੫ԡ࿗ԡ ͱԡऐ࿗Ꭾ ϟጢԡ ϟᎮԡԡ ϟᤃᤃᖔϟᤃᎮ ͱሕᎮᎮऐ
ऊዹԡᡸ੫ԡጢᎮԡ ͱԡጢᎮँ ሕԡ ϟጢᎮऐ ϟԡԡ ͱऐጢᤃ 螺旋ᢦᏇ᥋转角外ᖔ其余基因家族成员均是无规则卷
ऊዹԡᡸ੫ԡጢऐԡ ͱԡऐጢᤃ ϟԡᤃ ϟऐँ ϟᎮ ͱጢϟϟ 曲ᢦም᥋螺旋ᢦ延伸链ᢦᏇ᥋转角ྉ表 ࿗ᖔ图 ሕɯᤥ
ऊዹԡᡸ੫ϟጢጢጢԡ ͱϟԡሕԡ ԡ࿗ ϟ࿗ጢᤃ ᎮᎮ ͱሕँϟϟ
从图 ࿗ 分析发现ᖔ中粒咖啡 ۩ቴᣞɔ 转录因子基
ऊዹԡᡸ੫ϟँԡ ͱԡᤃϟऐ ࿗ᤃँ ሕϟϟ ሕԡᖔሕϟ ͱሕጢ࿗࿗
因家族蛋白的三级结构可以分为 ᤃ 类ᖔ分别以 ዶܦାܦ
ऊዹԡᡸ੫ጢԡԡ ͱϟԡሕᤃ ࿗ᤃ ϟሕᎮऐ ϟᤃऐ ͱᤃ
ऊዹԡᡸ੫ሕऐጢጢԡ ͱԡऐϟ ँऐ ϟᎮᎮऐ ϟᤃᤃᖔϟᤃᎮ ͱሕጢऐँ ऊܦ᧕ܦጶ 和 è 表示ᤥ 其中ᖔ᧕ 类成员最多ᖔ有 ጢ 个ଫ
ऊዹԡᡸ੫ሕऐᤃԡԡ ͱԡጢᤃ Ꭾ ϟሕሕሕ ϟᤃϟ ͱᤃऐँ 其次是 ዶ 类ᖔ有 ँ 个成员ଫጶ 类含有 Ꭾ 个成员ᖔା 类
ऊዹԡᡸ੫ሕँϟԡ ͱԡᤃᎮ࿗ ጢऐ ϟ࿗ᤃᎮ ϟԡऐ ͱँᤃᎮ
含有 ࿗ 个成员ᖔऊ 类含有 ሕ 个成员ଫ最少的是 è 类ᖔ
ऊዹԡሕᡸ੫ԡԡᤃᎮԡ ͱԡऐᎮጢ ᤃ ϟᎮϟϟ ϟጢऐ ͱሕऐሕሕ
只有 ϟ 个成员ᤥ 从三级结构稳定性来看ᖔ结构稳
ऊዹԡ࿗ᡸ੫ԡጢԡऐԡ ͱԡऐϟԡ ሕԡϟ ϟऐԡԡ ँᤃ ͱሕϟᤃᎮ
ऊዹԡ࿗ᡸ੫ϟጢ࿗ԡԡ ͱԡᤃऐ ࿗ँ Ꭾऐ ϟ࿗࿗ ͱऐԡԡ 定从强到弱的顺序为 è ᢦ ᧕ܦ ጶᢦ ዶ ᢦ ऊᢦ ାᤥ 其中ᖔ
ऊዹԡጢᡸ੫ԡ࿗ԡԡԡ ͱԡᎮሕऐ ጢᎮԡ ሕᤃᎮ ሕ࿗ᖔሕጢ ͱሕጢϟϟ ऊዹԡᎮᡸ੫ԡሕᎮሕԡ 以 ዹጢᢃ᧕ 结构为模板ᖔ有 ሕϟጢ 个氨
ऊዹԡጢᡸ੫ԡऐጢऐԡ ͱԡᤃ࿗ ሕጢ ϟऐጢᤃ ࿗ᤃ ͱँԡԡ
基酸 残 基 与 模板达到 ϟԡԡᠮ 的可信度ଫऊዹԡጢ ᡸ
ऊዹԡጢᡸ੫ԡँᤃሕԡ ͱԡँጢऐ ᤃऐ ϟ࿗ϟϟ ϟᤃ࿗ ͱሕ࿗࿗࿗
੫ԡऐጢऐԡ 以 ዹᑕᢃʛዶ 结构为模板ᖔ有 Ꭾጢ 个氨基酸残
ऊዹԡጢᡸ੫ϟ࿗ᤃᤃԡ ͱԡጢँ ࿗ᤃԡ ϟᎮ࿗࿗ ጢ࿗ ͱऐԡԡ
ऊዹԡጢᡸ੫ϟጢᎮँԡ ͱԡᎮᤃጢ ϟጢԡ ϟሕጢᤃ ࿗ᤃऐ ͱሕሕϟϟ 基与模板达到 ϟԡԡᠮ的可信度ᤥ
ऊዹԡᤃᡸ੫ԡ࿗ँԡ ͱԡऐԡ࿗ ँ ϟሕሕሕ ϟँᤃᖔᎮԡ ͱँᤃᎮ ԣॹ᎒ 氨基酸序列的保守基序分析
ऊዹԡᤃᡸ੫ԡሕ࿗Ꭾԡ ͱԡँԡऐ ሕϟ ϟጢሕሕ ሕጢᤃ ͱሕँᤃᎮ
借助 ᥘጶᥘጶ 在线工具搜索中粒咖啡 ۩ቴᣞɔ 基
ऊዹԡᤃᡸ੫ϟጢԡϟԡ ͱԡँϟሕ ᤃ࿗ᖔᤃጢ ϟᤃጢᤃ ሕሕऐ ͱሕ࿗࿗࿗
因家族成员的 ᥘᆍᡷᔽᖔ根据其保守性的强弱ᖔ依次命
ऊዹԡᎮᡸ੫ԡԡँऐԡ ͱԡऐጢ࿗ ϟᤃ ϟ࿗ϟϟ ϟԡ ͱሕሕሕሕ
ऊዹԡᎮᡸ੫ԡሕϟԡ ͱԡᤃ࿗࿗ ࿗ϟँᖔ࿗ԡ ϟ Ꭾ ͱሕԡᎮऐ 名为 ᥘᆍᡷᔽϟ ͱ ᥘᆍᡷᔽᤃᤥ 从序列 ᆍ੫ᆍ 可以看出ᖔ
ۼɟ᥈͐ 七肽序列的基序分别存在于 ᥘᆍᡷᔽϟ 和
ऊዹԡᎮᡸ੫ԡሕᎮሕԡ ͱԡጢሕ ࿗ᤃ Ꭾऐँ ऐ࿗Ꭾ ͱሕԡϟϟ
ऊዹԡᎮᡸ੫ԡᤃሕ࿗ԡ ͱԡ࿗Ꭾሕ Ꭾऐ ϟጢᎮऐ ࿗ँ ͱऐጢᤃ
ᥘᆍᡷᔽጢ 中ᖔ۩ቴᣞɔ 基因家族 ࿗ँ 个成员均具有 ᥘᆍᡷᔽϟ
ऊዹԡᎮᡸ੫ϟᤃ࿗ԡԡ ͱԡँጢ ऐँ ϟԡϟϟ ጢ࿗ ͱሕԡᤃᎮ
和 ᥘᆍᡷᔽᖔ推测 ᥘᆍᡷᔽϟ 是 ۼɟ 结构域ᤥ 每个成
ऊዹԡᎮᡸ੫ϟᤃጢᎮԡ ͱԡऐጢऐ ࿗࿗ ϟᎮԡԡ ԡሕ ͱᤃऐँ
ऊዹԡऐᡸ੫ԡᤃ࿗ԡ ͱԡᤃԡϟ ጢ ϟᤃ ԡ ͱሕϟ࿗࿗ 员至少都含有 ϟ 个 ۼɟ 七肽ᖔ其中最多的有 ጢ
个保守基序ᖔ最少的有 个保守基序ᤥ 有 ϟँ 个成
ऊዹԡऐᡸ੫ԡᎮऐጢԡ ͱԡᎮᎮᤃ ᤃँ ϟጢᤃ ሕϟ ͱऐ࿗࿗
ऊዹԡऐᡸ੫ԡᎮऐᤃԡ ͱԡᤃϟ ጢϟ࿗ ϟጢᤃ ሕ࿗ጢᖔሕ࿗ᤃ ͱऐ࿗࿗
员只有 ᥘᆍᡷᔽϟ 和 ᥘᆍᡷᔽଫ有 Ꭾ 个成员含有 ᥘᆍᡷᔽϟܦ
ऊዹԡऐᡸ੫ϟϟԡᤃԡ ͱϟϟँᤃ ϟᎮԡ ԡጢऐँ ϟԡ࿗ ͱሕऐϟϟ
ᥘᆍᡷᔽܦᥘᆍᡷᔽ࿗ܦᥘᆍᡷᔽጢ 和 ᥘᆍᡷᔽᤃྉ图 ጢᖔ表 ጢɯᤥ
ऊዹԡऐᡸ੫ϟጢᎮԡ ͱԡᤃँϟ ሕԡᎮ ϟᎮᤃᎮ ϟ࿗࿗ ͱሕँᤃᎮ
ԣॹࣽ 中粒咖啡 ۩ቴᣞɔ 蛋白的分子进化分析
ऊዹԡऐᡸ੫ϟጢँԡ ͱԡᤃϟ࿗ ጢሕ ϟ࿗ጢᤃ ϟϟऐ ͱᤃ
ऊዹԡऐᡸ੫ϟጢँϟԡ ͱԡᎮԡँ ጢ ᤃᎮ ϟँᖔԡ ͱሕ 对 ۩ቴᣞɔ 基因家族成员蛋白序列进行多重比对
ऊዹԡँᡸ੫ԡϟ࿗ሕԡ ͱԡᤃϟ࿗ ጢ࿗ ሕ࿗࿗ ϟऐ࿗ᖔϟऐጢ ͱሕϟऐँ
分析ᖔ将下载的 ࿗ँ 个家族成员蛋白序列输入 ᥘጶ᥈ዶᖔ
ऊዹԡँᡸ੫ԡሕᤃ࿗ԡ ͱԡँᎮ ϟϟ ϟϟᎮऐ ࿗ጢ ͱሕ࿗ऐँ
并绘制出中粒咖啡 ۼɟ 蛋白的进化树ྉ图 ᤃɯᤥ 从
ऊዹԡँᡸ੫ԡᎮሕሕԡ ͱԡᎮऐ ԡϟ ϟጢᎮऐ ࿗ϟ ͱሕሕϟϟ
进化树的聚类结果可以清晰地看出ᖔ这 ࿗ँ 个成员分
ऊዹԡँᡸ੫ԡऐሕԡԡ ͱԡᤃᎮऐ ϟԡ ϟऐँ ϟԡᤃ ͱँᎮऐ
ऊዹԡँᡸ੫ԡँϟँԡ ͱԡऐᤃ ࿗ሕ ϟጢᤃ ϟሕ ͱሕጢጢᤃ 成了 ᤃ 组ྉ依次称为 ᥈ʢᆍࣼᡱ ϟܦ᥈ʢᆍࣼᡱ ܦ᥈ʢᆍࣼᡱ ሕܦ᥈ʢᆍࣼᡱ
ऊዹϟԡᡸ੫ԡ࿗ऐϟԡ ͱԡᎮ࿗ Ꭾऐ ϟጢ࿗࿗ ϟϟጢᖔϟϟᤃ ͱँᎮऐ
࿗ܦ᥈ʢᆍࣼᡱ ጢ 和 ᥈ʢᆍࣼᡱ ᤃɯᤥ 其中ᖔ᥈ʢᆍࣼᡱ ϟ 成员最多Џϟ࿗
ऊዹϟԡᡸ੫ԡᤃ࿗ԡԡ ͱԡँԡँ ँጢ ϟԡऐँ ࿗ ͱᎮ࿗࿗
个ᖔऊዹۼɟԡँᖔऊዹۼɟϟϟᖔऊዹۼɟϟሕᖔ ऊዹۼɟϟऐᖔ
ऊዹϟϟᡸ੫ϟϟԡ ͱԡऐԡ ϟϟ ԡँጢᤃ ϟϟँ ͱँԡԡ
ऊዹϟϟᡸ੫ϟ࿗ऐԡ ͱԡऐሕ ϟϟᤃ ϟ࿗ሕሕ ሕᎮऐ ͱሕጢᤃ ऊዹۼɟ࿗ᖔ ऊዹۼɟऐᖔ ऊዹۼɟँᖔ ऊዹۼɟሕሕᖔ
ऊዹϟϟᡸ੫ϟᎮϟᎮԡ ͱԡᎮሕ ጢጢ ϟᎮ ϟϟँ ͱᤃऐँ ऊዹۼɟሕጢᖔऊዹۼɟ࿗ԡᖔऊዹۼɟ࿗ϟᖔ ऊዹۼɟ࿗ሕᖔ