作者:任思齐等   来源:   发布时间:2021-10-10   Tag:   点击:
[麻进展] 罗布麻 MYB 转录因子家族生物信息学分析
摘 要:MYB(v-myb avian myeloblastosis viral oncogene homolog)是近年来发现的参与调控植物生长发育、生理代谢和响应逆境等的一类重要转录因子。为了探究 MYB 转录因子家族在罗布麻中的功能,本研究基于罗布麻第二代和第三代转录组测序数据,共查找到 57 条 MYB 基因,其氨基酸数目介于 88~1 088 之间,分子量大小介于 10.45~121.49 之间,保守结构域分为 1R-MYB 和 R2/R3-MYB 两个亚类;经理化性质分析发现,罗布麻 MYB 转录因子家族蛋白均为亲水性蛋白,并具有较高的热稳定性;由保守基序分析发现,不同 MYB 转录因子包含的保守基序的数目不同,数目介于 1~5 之间;经高级结构预测,MYB 转录因子家族蛋白以α-螺旋和无规卷曲结构为主;由系统进化树发现,罗布麻 MYB 序列在进化上可分为 18 个小类,根据与罗布麻具有高的同源性的拟南芥 R2/R3-MYB 亚族的功能,可预测罗布麻 MYB 基因的功能
关键词:罗布麻 MYB 生物信息学
 
MYB 基因家族是高等植物最大的一类转录因子家族之一。MYB 以其蛋白序列 N 端的特殊 R 结构为 保守结构域,根据结构域的个数不同,可分为 1R-MYB、2R-MYB (R2/R3)、3R-MYB 和 4R-MYB 四个亚类。MYB 转录因子参与众多生物学过程,主要包括调控植物次生代谢反应、细胞形态与模式建成、植物生长发育、对生物和非生物胁迫进行应答等在内的许多生命活动。MYB转录因子可以调控多种植物器官的生长发育,在拟南芥、芒果和辣椒等多种植物中均有体现。在应对生物胁迫时,MYB转录因子可以调控植物对病原菌的忍耐以及参与病毒侵染的调控;在应对非生物胁迫时,MYB 转录因子参与调控干旱、低温、盐害等逆境影响。因此,MYB 转录因子对植物的抗逆性 有重要的的调节作用。MYB 家族成员还可 以调控植物对温度的响应,从而影响植物次生代谢途径,如花青素、黄酮类化合物的合成等过程。MYB 转录因子也参 与植物激素的应答,目前对脱落酸,油菜素内酯等激素的响应的相关研究十分丰富,其中对脱落酸 MYB 基因表达的研究较为深入。 罗布麻(Apocynum venetum)属夹竹桃科罗布麻属,多年生草本植物,在我国的新疆、河北、陕西、内蒙古、青海、甘肃等地以及俄罗斯、中西亚地区、蒙古、印度、美洲等地均有分布。罗布 麻可以在干旱、盐碱等多种极端环境下生存,具有显著的抗逆性优势。根据唐代《新修本草》和明代《救荒本草》等古药典记载,罗布麻全草均可入药,具有平肝安神,利水消肿,清火降压,强心利尿,止咳平喘等功效,具有一定药用价值。根据《中华人民共和国药典》和后续研究可知,罗布麻能够产生包括脂肪酸醇酯、醇类、甾体类、糖类、烷类,黄酮类物质在内的多种次生代谢产物,具有抗辐射,抗癌和抗肿瘤等功效。目前,罗布麻生理机制尚未探究清楚, 关于其具有抗逆性优势以及可以生成多种次生代谢产物的原理尚不明晰。
为了探究 MYB 转录因子家族基因在罗布麻中功能,本研究对罗布麻 MYB 转录因子家族进行生物信息学分析,对MYB转录因子的序列结构、特点、理化性质、功能等方面进行分析预测,并与拟南MYB 转录因子进行系统进化分析,为进一步揭示罗布麻的抗逆及次生代谢生理机制提供理论和数据基础。
1 材料与方法
2.1 罗布麻和拟南芥 MYB 序列来源
从罗布麻二代、三代测序全长中挖掘到 123条MYB序列,本地使用DNAMAN 进行核苷酸序列一致性比 对去重复,转化为蛋白序列后,利用SMART和NCBI Blast 进行结果推测,发现共有57条具有MYB转录因子家族保守结构域的蛋白序列,并利用NCBI的CCD数据库对蛋白保守结构域进行鉴定。对MYB基因家族 进行分类,将罗布麻MYB蛋白序列归类到1R-MYB、R2/R3-MYB、R1/R2/R3-MYB类MYB转录因子亚族中。拟南芥(Arabidopsis thaliana, At)的MYB蛋白序列从拟南芥数据网站TAIR(https://www.arabidopsis.org/)中下载,通过与本地罗布麻MYB家族蛋白比对筛选出其中结构相类似的38条序列。
2.2 罗布麻MYB转录因子理化性质分析
使用Protparam在线对罗布麻MYB转录因子家族基因编码蛋白的氨基酸数目、分子量、等电点、脂肪系数、亲水系数等理化性质进行分析。
2.3 罗布麻MYB转录因子亚细胞定位预测
通过在线亚细胞定位网站 WoLF PSORT (https://www.genscript.com/wolf-psort.html)对罗布麻 MYB 转录因子家族蛋白进行亚细胞定位预测。
2.4 罗布麻MYB转录因子氨基酸基序分析
通过在线 MEME 网站(http://meme-suite.org/index.html)对罗布麻 MYB 转录因子家族蛋白进行保守氨基酸 基序分析。
2.5 罗布麻MYB家族基因序列功能预测
通过本地OmicsBox软件将罗布麻MYB家族基因序列在GO数据库中进行细胞组分(Cellular component)、 分子功能(Molecular function)和生物学功能(Biological process)三个方面的功能预测。
2.6 罗布麻与拟南芥进化系统分析
利用本地DNAMAN软件对57 条罗布麻MYB转录因子蛋白和从拟南芥数据库中筛选出的与罗布麻MYB转录因子序列功能结构相近的38条MYB蛋白的氨基酸序列进行多序列比对。利用MEGA-X软件,对罗布麻MYB基因与拟南芥MYB基因的进化树进行绘制。绘制进化树的方法选择邻接法(NJ, Neighbor-Joining),参数 设置时选择 P-distance、pairwise deletion 以及 Bootstrap method=2000,其他参数均为默认选项。
2.7 罗布麻 MYB 转录因子蛋白结构分析
利用 PredictProtein 网站在线网站对罗布麻 MYB 转录因子蛋白的二级结构进行分析,再利用在线软件 Phyre2 (http://www.sbg.bio.ic.ac.uk/phyre2/html/page.cgi?id=index)对罗布麻 MYB 转录因子家族蛋白进行蛋白三 级结构的同源建模分析。
2 结果与分析
2.1 罗布麻 MYB 转录因子家族基因的挖掘以及蛋白序列的分类
罗布麻二代、三代测序结果中筛选出123条MYB转录因子家族基因序列,通过SMART和NCBI Blast预测,本地使用DNAMAN核酸一致性比对去重复后,最终得到57条具有完整的MYB转录因子保守结构域的序列。根据NCBI中 CCD 数据库对筛选出的57条罗布麻 MYB 转录因子家族蛋白进行比对分类,最终得到 1R-MYB 序列 12 条,R2/R3-MYB 序列44条,R1/R2/R3-MYB 序列1条
2.2 罗布麻 MYB 转录因子家族蛋白质理化性质分析及亚细胞定位
利用 Protparam 软件对罗布麻 MYB 转录因子家族编码的蛋白进行理化性质在线分析(表 1),57个MYB转录因子编码的氨基酸数目介于88~1 088之间,最小和最大值分别对应于MYB49和MYB53,对应的分子量大小分别为10.45和 121.49。等电点大小介于4.93~10.24之间,最小和最大值分别对应于MYB37和 MYB51。脂肪系数介于57.39~94.38 之间,说明 MYB 转录因子基因编码蛋白的热稳定性较好。亲水系数均为负值,说明MYB家族蛋白均为亲水性蛋白。在线亚细胞定位软件WoLF PSORT结果显示,MYB转录因子亚细胞定位多处于细胞核中,也有少数分布于叶绿体、线粒体、细胞质中

     
 
 
2.3 罗布麻 MYB 转录因子家族蛋白的保守基序分析
利用DNAMAN以及在线MEME对57条罗布麻MYB转录因子蛋白序列进行蛋白保守基序分析(图1)。转录因子蛋白序列含有 motif1-motif5,通过 MYB 转录因子蛋白的保守基序预测(图 2)发现,不同 MYB 转录因子包含的保守基序的数目不同,通常介于 1~5 之间。多数 motif 元件集中分布于蛋白序列 N 端,少数 分布于序列中间甚至偏靠 C 端。除此之外,motif1motif2、motif3 出现的频率最高,故推测三者是罗布麻 MYB 转录因子的特征基序
 
 
2.4罗布麻 MYB 转录因子家族基因的功能注释
利用 OmicsBox 软件对罗布麻 MYB 基因家族分别进行 NCBI blast、GO 数据库 Mapping、Annotation、 Slim、InterproScan 后,进行基因注释绘图(图 3)。在生物学功能水平上,超过半数的罗布麻 MYB 转录因子蛋白参与了细胞过程,部分参与了代谢过程、发育过程以及应激过程等;在分子功能水平上,几乎所有参与分析的基因均具有结合活性,半数以上具有转录调节的活性;在细胞组分水平上,绝大部分序列编码的蛋白都在细胞或者细胞器水平承担着生物学功能。
 
2.5罗布麻与拟南芥 MYB 转录因子的系统进化分析
 
利用 MEGA X 软件对罗布麻 57 条 MYB 转录因子基因序列及拟南芥 MYB 转录因子家族基因序列构建系 统进化树(图 4)。图 2 中可以看出有 3 条罗布麻转录因子序列未被归入分类小组,占比 5.26%,划入分类小组的罗布麻转录因子序列占比 94.74%。除了 10 条罗布麻 MYB 序列与拟南芥在进化上的同源性较低外,其余序 列均可在拟南芥的序列中找到进化上的相似性。两个亚族 1R-MYB 和 R2/R3-MYB 转录因子的基因序列均存在许多与拟南芥同源序列进化而来的现象。总体来说,罗布麻与拟南芥 MYB 转录因子家族的具有很高的同源性,和拟南芥转录因子相邻或者距离比较近的进化关系上的罗布麻转录因子很可能和拟南芥具有相同或相似的生物学功能
2.6 罗布麻 MYB 转录因子家族蛋白高级结构分析
2.6.1 蛋白质二级结构分析
利用在线 PredictProtein 网站分别对罗布麻 MYB 转录因子 1R-MYB1 与 R2/R3-MYB13蛋白序列进行二级 结构分析(图 5),结果显示大部分转录因子蛋白都具有螺旋、环状结构。从图(a)和图(b)两种亚类的 MYB 蛋白螺旋的分布可以看出1R-MYB亚族的转录因子可能比R2/R3-MYB亚族具有更大比例的螺旋结构,R2/R3-MYB 亚族的转录因子蛋白的螺旋结构相较于 1R-MYB 亚族分布更为集中。据此可以推测MYB 转录因子蛋白的二级结构是以 α-螺旋为主,处于 MYB 转录因子蛋白保守结构域的位置,并参与维持蛋白结构中重要的螺旋-转角-螺旋(HTH)结构。β-折叠、β-转角以及无规卷曲则分散地分布于蛋白结构中
2.6.2 蛋白质三级结构分析
分别选取1R-MYB亚族的1R-MYB1、1R-MYB2和R2/R3-MYB 亚族的 R2/R3-MYB13、R2/R3-MYB34 序列进行蛋白质三级结构分析(图 6)。结果表明罗布麻MYB转录因子蛋白家族含有α-螺旋、无规卷曲、β-折叠和β-转角,与罗布麻MYB转录因子家族蛋白的二级结构预测相符合。1R-MYB 亚族蛋白的三级结构较为简单,一般由 5~6 个α-螺旋及若干无规卷曲、β-转角等构成,而 R2/R3-MYB 亚族蛋白的三级结构则明显比 1R-MYB 蛋白三级结构要复杂,一般由 8~10个α-螺旋及数个其他二级结构所构成。并且从 R2/R3-MYB 亚族 蛋白的三级结构预测图中可以明显看出MYB 转录因子家族蛋白的特殊螺旋-转角-螺旋(HTH)结构。无规卷曲的长度是不同MYB转录因子蛋白的主要区别,α-螺旋的数量是 1R-MYB 亚族蛋白的主要区别。
3 讨论
目前对 MYB 转录因子的研究涉及多种植物,其中花生、地黄、黑果枸杞等通过转录组数据鉴定出443 个、165 个、83 个 MYB 基因。而本研究从罗布麻二代、三代测序结果中筛 选出123条 MYB 转录因子家族基因序列,其中1R-MYB 序列12条,R2/R3-MYB 序列44条,R1/R2/R3-MYB 序列1条。所有亚类中,R2/R3-MYB 最多,与喜马拉雅紫茉莉,辣椒等植物相同。
罗布麻MYB 转录因子蛋白家族序列具有大量碱性氨基酸残基,从而具有热稳定性以及亲水性。多数转录因子家族蛋白位于细胞核内,也有部分 MYB 转录因子蛋白位于叶绿体、线粒体及其他核外结构中。其中最大的亚类 R2R3-MYB 基因所编码的蛋白亚细胞定位绝大部分在细胞核中,与 R2R3-MYB 基因编码的蛋白的亚细胞定位全部在细胞核中的桂花有所区别。
蝴蝶兰MYB家族基因中存在多个保守结构域,其中4个相似度较高,motif3-motif1-motif2 结构相对稳定。马尾松 MYB 含有 motif1-motif10,其中 motif1,motif2 出现 频次最高。罗布麻 MYB 转录因子蛋白序列含有 motif1-motif5,其中 motif1、motif2、motif3,三者出现的频率最高。三者有一定区别,但三者的 motif1,motif2 均出现频率高且稳定。越橘果实 R2R3-MYB 转录因子在功能注释分类中,涉及植物次生物质合成、代谢和转运、氨基酸转运与代谢等一些生理生化途径。罗布麻 MYB 转录因子部分参与了代谢过程、发育过程以及应激过程等,几乎所有参与分析的基因均具有结合活性,半数以上具有转录调节的活性,绝大部分序列编码的蛋白都在细胞或者细胞器水平承担着生物学功能,两者相似性很大。罗布麻 MYB 转录因子蛋白家族的二级结构包括α-螺旋、β-转角、β-折叠和无规卷曲,其中以无规卷曲为主,且 R2/R3-MYB 亚族的蛋白结构更为复杂,这与α-螺旋和无规卷曲具有较大的占比,β-转角和延伸链占比相对较小的芒果MYB转录因子类似。从1R-MYB 和 R2/R3-MYB 亚族的转录因子蛋白中分别选取具有代表性的 1R-MYB6、1R-MYB48 以及 R2/R3-MYBB、R2/R3-MYB3R-1-1蛋白进行蛋白三级结构建模,结果图可以展现两个亚族的空间结构,α-螺旋和无规卷曲的结构十分清晰,而不同亚族的区别主要体现在α-螺旋的数量以及无规卷曲的长度上。
将罗布麻与筛选出的结构功能和罗布麻相似的拟南芥 MYB 转录因子蛋白编码序列进行系统进化分析,发现大部分罗布麻 MYB 序列与拟南芥序列有一定的亲缘进化关系,相当一部分罗布麻 MYB 家族基因序列在进化树上与拟南芥相同结构域的基因相邻,进而对罗布麻 MYB 基因的功能进行预测。1R-MYB 参与植物的生长发育过程,如 ATMYB88 在拟南芥中参与植物气孔的发育,根据进化系统分析推测罗布麻中与之具有相近亲缘关系的 MYB9 可能参与罗布麻中气孔的发育;ATMYB1 包含编码原癌基因的序列,由此推测罗布麻中 MYB53 与癌症治疗有关。罗布麻 R2/R3-MYB 转录因子的基因序列也存在许多与拟南芥同源序列进化而来的现象,说明R2/R3-MYB 亚族中罗布麻与拟南芥也具有很高的同源性。拟南芥 R2/R3-MYB 转录因子能调控细胞分化,调节植物的生长,与之同源的菠萝R2/R3-MYB参与了乙烯利诱导条件下菠萝的生长发育。拟南芥 R2/R3-MYB 作为调节蛋白参与到类黄酮和苯丙烷类的代谢途径,从而控制植物色素的合成。不仅于此,拟南芥 R2/R3-MYB 转录因子还可以参与细胞壁的合成,与拟南芥 R2/R3-MYB 转录因子有同源性的杨树 MYB 转录因子,水稻 MYB 转录因子和玉米 MYB 转录因子都参与了细胞壁的合成。拟南芥 R2/R3-MYB 转录因子同时易受各种环境因子所诱导,如信号分子(ABA, SA, JA 等)、病原体、干旱、低温、创伤、高盐胁迫等,广泛参与了对调控植物逆境胁迫响应有重要作用的激素应答过程。与之同源的柑橘 R2R3-MYB 转录因子家族成员就对多种病原进行应答,参与自体的抗逆性调节。因此推测罗布麻 R2/R3-MYB 是罗布麻次生代谢产物合成、生长发育调节以及响应逆境胁迫的一类重要因子
基于罗布麻组的转录数据,通过对罗布麻 MYB 转录因子生物信息学分析,对其在罗布麻中发挥的功能进行了合理预测,为进一步研究罗布麻 MYB 转录因子功能,探究其生理机制提供了必要的理论基础。  
 
文章摘自:任思齐,蔚丽慧,魏美玲,郑佳敏,何茂硕,郑恺,范桂枝.罗布麻MYB转录因子家族生物信息学分析[J/OL].分子植物育种:1-12[2021-02-18]

更多阅读