作者:尹明等   来源:   发布时间:2021-10-10   Tag:   点击:
[麻进展] 大麻GRAS转录因子家族的全基因组鉴定及镉胁迫下表达分析
 要:GRAS转录因子在植物生长发育及抗逆境胁迫中具有重要作用。本文对大麻 GRAS 转录因子家族进行了全基因组鉴定,对其理化性质、系统进化发育、基因结构、基因间的共线性关系进行了分析,并利用云麻1号及内蒙古小粒大麻的转录组数据分析其在镉胁迫下的表达量变化。结果表明,大麻基因组中鉴定出 54GRAS基因,96.30%的基因编码酸性蛋白,长度为415~757aa,分子质量为46405.05~85748.52kD,等电点为4.77~8.54,划分为9个亚家族,其中PAT1LSSHRHAM保守性较高,PAT1LISCLCsGRASA出现大量基因串联重复,CSGRAS12基因在5种植物的共线性分析中均存在。将2个大麻品种进行镉胁迫处理发现,云麻1号株高下降10.48%,鲜重下降6.33%;内蒙古小粒大麻株高下降66.07%,鲜重下降42.67%,表明云麻1号较内蒙古小粒大麻更耐镉胁迫。云麻1号的54GRAS基因中,42(77.78%)基因上调1.05~18.1011(20.37%)基因表达下调0.13~0.91;内蒙古小粒大麻的54GRAS基因中,27(50.00%)基因上调1.01~6.4627(50.00%)基因下调0.30~0.96。将两者GRAS 基因进行同源基因鉴定并分析其表达情况发现,耐镉品种云麻1号中40个同源GRAS基因较内蒙古小粒大麻在镉胁迫下的上调或下调幅度更明显,表明这些GRAS基因与镉胁迫有明显相关性。本文可为挖掘和验证大麻GRAS基因提供参考。
关键词:大麻;GRAS转录因子;系统发育分析;基因结构分析;表达分析
 
转录因子是一类能与基因序列上游特定序列结合的蛋白质,通过改变基因表达来调节生物学过程,在植物生长发育及对外界胁迫的响应中发挥重要作用。GRAS转录因子由GAIRGASCR 3个早期鉴定的功能基因而命名,被认为在植物的生长与抗逆境胁迫中具有重要作用,早期被认为只存在于植物中,近期发现细菌中也含有该基因家族,并有研究提出GRAS基因家族最早出现在细菌中的折叠甲基转移酶超家族中。GRAS蛋白质一般至少由350个氨基酸组成,包括1个高度保守的C端和1个可变的N端,其C端由SAWLRILRIIPFYREVHIID 5个保守基序组成,其中VHIID最为保守,是GRAS蛋白的核心结构,存在于所有亚家族成员中。有研究发现,N端是GRAS蛋白发挥特异性功能的重要部位,因为N末端含有IDRs序列,该序列表达时会与不同蛋白质结合,而后能够表现出蛋白质的特异性。早期的拟南芥GRAS基因分为LSPAT1SCL3DELLALISCLSCRHAMSHR 8个亚家族,随后有研究在8个亚家族的基础上新增了DLTSCL4/7亚家族,将GRAS基因分为10个亚家族,不同的GRAS亚家族导致了该基因家族功能的多样性。有研究发现,GRAS基因在植物根的形态建成、茎段分生组织的分化、激素信号转导、逆境胁迫响应等过程中发挥重要作用。比如SCRSHR亚家族参与拟南芥侧根的发育,SHR/SCR/SCL3在番茄丛枝菌根化过程中可能参与调控赤霉素;PAT1分支中的PAT1SCL21参与了光敏色素A(phytochromephyA)的信号转导,使下胚轴在脱黄化时逐渐拉长;OsDLTOsGRAS19在水稻的油菜素类固醇(brassinosteroidsBR)信号转导中作为正向调节因子发挥作用。
目前多种植物的GRAS基因家族都已进行了全基因的鉴定与分析,在拟南芥、水稻、木薯、棉花和小麦中分别存在346077150153GRAS基因。在各个植物都开始深入研究和挖掘该基因家族时,众多麻类作物中尤其是大麻都还未见相关报道。大麻又称汉麻,用于纺织、3医药、护肤保健等领域,其中四氢大麻酚(tetrahydrocannabinolTHC)含量低于0.3%的称为工业大麻,近年来由于发现大麻对重金属具有较强的耐性,且具有较高的经济价值,大麻开始被用于修复重金属污染土壤,有研究发现重金属可以降低大麻中的THC含量,并提升其大麻二酚(cannabidiolCBD)含量。随着国际上对工业大麻的解禁及CBD 医疗市场的扩大,培育耐重金属及其他非生物胁迫的工业大麻品种显得十分重要。而GRAS基因与植物生长及耐非生物胁迫有着密切的关系,已有研究发现,过表达玉米ZmGRAS31基因,可以改善玉米的耐盐性;过表达山葡萄VaPAT1基因可以显著提高了拟南芥的耐旱性、耐寒性和耐盐性,过表达毛竹PeSCL3基因可增强其耐旱性,过表达小麦AtSCL14可增强其耐光氧化胁迫的能力,虽然这些研究已证明GRAS家族与植物的非生物胁迫有关,但在GRAS家族与重金属镉胁迫之间还未有相关研究。
本研究旨在通过生物信息学方法在全基因组水平上对大麻GRAS基因的组成进行鉴定,分析其理化性质、进化关系、基因结构、共线性关系,同时利用2个大麻的镉胁迫下转录组数据及其qPCR验证分析该基因家族表达情况,以期为后续研究大麻GRAS基因功能提供参考。
材料与方法
1.1 大麻GRAS基因的鉴定与理化性质分析
NCBI数据库(https://www.ncbi.nlm.nih.gov/)中下载大麻基因组文件与基因组注释文件(assembly numberGCA_900626175.2),从TAIR数据库(https://www.arabidopsis.org/)中下载拟南芥GRAS基因序列。利用软件TBtools将拟南芥GRAS基因与大麻基因组进行blast序列比对(E-vaule<1E-5),筛选大麻的中GRAS家族候选基因。将候选基因提交至uniprot数据库(https://www.uniprot.org/)进行批量比对,验证候选基因是否含有GRAS保守结构域,删除假阳性基因。利用在线分析软件ExPASy Proteomics(http://web.expasy.org/compute_pi)分析理化性质。
1.2 大麻GRAS基因系统进化树的构建和基因结构分析
将拟南芥与大麻的GRAS蛋白序列导入软件MEGA7.0进行比对,将比对后的结果采用相邻连接法(neighbor-joiningNJ;执行参数:Bootstrap method 1000)构建系统进化树,并利用软件FigTree进行完善美化进化树。利用在线软件NCBI-CDD(https://www.ncbi.nlm.nih.gov/cdd/)进行蛋白结构预测,检测大麻GRAS的蛋白结构域(E-vaule<0.01)。利用在线软件MEME(http://meme-suite.org/)分析大麻GRAS基因保守基序(Motif),设定预测数为10。利用软件TBtools从大麻基因组注释文件中提取大麻GRAS的相关编码序列(Coding SequenceCDS)、非翻译区(Untranslated RegionUTR)。利用TBtools将进化树、蛋白结构域、基因保守基序、CDSUTR结合,构建GRAS进化关系与结构的整体比对图。
1.3 大麻GRAS基因的染色体分布与共线性预测
利用软件TBtools从大麻基因组文件与基因注释文件中提取GRAS基因位置信息,并构建GRAS基因在染色体上的物理图谱。利用软件TBtoolsMCScanXCircos计算并绘制大麻GRAS在染色体上存在的串联重复,大麻不同染色体之间存在的共线性基因,大麻与大豆、雷蒙德氏棉、玉米、水稻不同物种间存在的共线性基因。
1.4 材料培养及处理与转录组测序
本试验选取2个大麻品种籽粒大小较一致的种子,置于黑暗条件下25℃萌发3d,将幼苗移至1/4 Hoagland营养液中生长5d,昼夜温度24℃/16℃,光周期16h/8h(/),相对湿度60%,光强度700μmol m-2 s-1。对生长5d的幼苗进行处理:对照(仅营养液)12h100μmol L-1CdCl2处理12h。在2个处理下取长势一致的植株,用TRIzol试剂(美国Invitrogen)提取总RNA,并溶于无RNase的水中(TransGen Biotech,中国),用NanDrop 2000(Thermo Scientific,美国)检测RNA的质量、纯度和完整性。使用Illumina Truseq RNA样品制备试剂盒构建cDNA文库,设3个生物学重复,之后进行转录组测序。通过Illumina测序平台(Illumina HiSeq 4000)进行测序,通过CASAVA Base Calling分析将原始测序数据转换为Sequenced ReadsRaw Reads,并再次过滤以获取高质量的纯净读数。利用TopHat2HISAT2两个软件将质控后的数据与Cannabis sativa(版本号GCF_900626175.2)参考基因组进行对比,使用String TieCufflinks软件对Mapped Reads进行拼接。将转录组原始数据匹配至全基因组分析得到的工业大麻GRAS基因并统计reads数量,并进一步换算成FPKM值进行比对分析。
1.5 实时荧光定量PCR验证
本试验随机选取转录组中12GRAS家族基因进行实时荧光定量PCR验证,利用Primer 3 plus设计荧光定量PCR引物,内参基因选取Hemp actin,其上下游引物序列为Sense5-CCAATAGCCTTGCATTCCAT-3Anti-sense:5-TCGATTGGAAAGCCGAATAC-3。试验仪器使用BIO-RAD(伯乐)CFX Connect荧光定量PCR仪,所取样品与RNA-Seq所选样品一致,使用TIANGEN试剂盒提取RNA,用Takara反转录试剂盒合成cDNA,利用Aidlab试剂盒进行实时荧光定量PCR验证。反应条件为95℃预变性2min95℃变性15s60℃退火30s40个循环。采用2–ΔΔCt法计算目的基因的相对表达量。
结果与分析
2.1 GRAS基因成员的鉴定及其理化性质分析
利用拟南芥GRAS基因与大麻基因组进行序列比对,将获得的基因在Swissport数据库中进行结构域分析,筛选出具有GRAS保守结构域的基因,最终鉴定出54个大麻GRAS基因,根据大麻基因CDS片段,将54GRAS基因命名为CsGRAS01~CsGRAS54(1)。大麻GRAS蛋白长度为415~757aa,平均长度586aa;分子质量为46405.05~85748.52kD,平均分子质量66199.41kD;等电点为4.77~8.54,其中等电点小于7GRAS蛋白有52个,偏酸性;其余的2GRAS蛋白等电点大于7,偏碱性。

2.2 GRAS基因的系统进化树构建和基因结构分析
为深入理解大麻GRAS不同基因间的进化关系,通过构建大麻与拟南芥中GRAS基因进化树,将大麻中54GRAS基因分成LSLISCLSCRHAMSCL3DELLAPAT1SHRCsGRASACsGRASB10个亚家族(1)。其中PAT1亚家族成员最多,含13个基因;SCL3亚家族成员最少,含1个基因。大麻中新鉴定出2个亚家族,CsGRASA含有5个成员,CsGRASB含有3个成员,2个亚家族都不含任何拟南芥GRAS成员,单独形成一个分支,而且亲缘关系较远。从图2可以看出,相同亚家族的基因结构基本一致,相同亚家族的保守基序也具有相似性,表明同一个亚家族的基因具有相似的功能。在大麻GRAS基因中,83.33%(45/54)的基因无内含子,DELLA亚家族有3个基因,其中CsGRAS3Motif分析中未发现DELLA结构域,可能是相邻连接法的算法将基因错误划分到了DELLA亚家族,也有可能是其高度可变的N端序列差异导致其不能与同一亚家族的基因进行聚类,水稻中GRAS家族成员也有相似的结果。在所有大麻GRAS基因成员中都含有基序135,表明这3个基序在GRAS中高度保守(3),具有重要作用。

 

1 大麻、拟南芥的GRAS基因系统进化树
 图2 大麻GRAS基因结构分析
 
3 大麻GRAS基因基序
2.3大麻GRAS基因的染色体分布与共线性分析
大麻染色体上GRAS基因位置分析表明,大麻GRAS基因分布在10个染色体上,与染色体长短无显著相关性(4)。染色体NC6包含10GRAS基因,NC1包含9GRAS基因,为含GRAS基因最多的2个染色体;NC9包含的GRAS基因最少,只有1个;其他染色体包含3~6GRAS基因。其中5个染色体上出现了基因的串联重复情况,尤其在NC1NC6NC7三个染色体上,出现了大量GRAS基因的串联重复(相同染色体上基因有红色线段连接,表示相关基因为串联重复基因),串联重复基因占全部GRAS基因的44.44%,表明大麻GRAS家族发生过明显的基因串联复制事件,也表明基因串联重复事件在大麻GRAS家族的扩展中具有关键作用。通过大麻染色体间的共线性分析(有红色线段连接的为共线性基因)发现4对共线性基因(5),除CsGRAS8CsGRAS9HAM亚家族,其他均分属不同亚家族,这些基因是通过复制而得到相同连续顺序的旁系同源基因。通过旁系同源基因的预测,我们了解到NC5NC6NC8NC104个染色体可能经历过染色体的片段复制,而这4个染色体都能联系到NC10,表明NC10可能是4个染色体中GRAS家族的关键染色体。为进一步了解大麻GRAS家族的进化机制,构建了大麻与雷蒙德氏棉、大豆、水稻、玉米的GRAS家族共线性关系图(6和图7),这4种植物分别属于双子叶与单子叶植物。最终鉴定出大麻与雷蒙德氏棉有32对直系同源基因、与大豆有45对直系同源基因、与水稻有5对直系同源基因、与玉米有2对直系同源基因,这也符合大麻与4种对应植物的进化关系。对5种植物进行共线性分析发现,GRAS6GRAS8~10GRAS14~19GRAS23GRAS335种植物中未被鉴定到,其中大部分都是串联重复基因,可能是大麻原有GRAS基因进行串联重复扩增而来,这些基因可能是双子叶与单子叶植物GRAS基因功能差异的相关基因,而GRAS125种植物中都被鉴定到,且该基因包含GRAS基因中的motif 1~10,推测该基因可能是双子叶植物与单子叶植物分化前就存在的GRAS基因。

4 大麻GRAS基因的染色体定位

 
 
5 大麻染色体间GRAS基因共线性分析
 
6 雷蒙德氏棉、大麻、水稻间GRAS基因共线性分析
 
7 大豆、大麻、玉米间GRAS基因共线性分析
2.4 镉胁迫下不同大麻耐性筛选
将云麻1号、甘肃大麻、内蒙古小粒大麻、内蒙古油用大麻、内蒙古土右旗大麻、皖大麻6种大麻进行镉胁迫萌发试验发现,云麻1号发芽率最高,内蒙古小粒大麻发芽率最低。在镉胁迫水培试验中,云麻1号镉处理组和对照组平均株高分别为9.4cm10.5cm,平均鲜重分别为7.4g7.9g;内蒙古小粒大麻镉处理组和对照组平均株高分别为3.8cm11.2cm,平均鲜重分别为4.3g7.5g。在重度镉污染耕地中,云麻1号亩产鲜重1408.96 kg,内蒙古小粒大麻亩产鲜重 744.93 kg,表明云麻1号较内蒙古小粒大麻更耐镉胁迫。

 

8 两个大麻品种在正常环境与镉胁迫环境的生长状况
2.5 两个大麻品种在镉胁迫下GRAS基因的表达分析及qPCR验证
为了解大麻GRAS基因在正常条件及镉胁迫条件下的表达情况,对云麻1号及内蒙古小粒大麻在2个环境下的植株进行了转录组测定,表中各组基因的表达量均为3个重复的平均数。结果显示,在云麻1号的转录组数据中(2)11个基因表达下降(占比20.37%),下降倍数为0.13~0.9142个基因表达上调(占比77.78%),上调倍数为1.05~18.101个基因表达未发生变化(占比1.85%);其中28个基因变化值差异显著。在内蒙古小粒大麻的转录组数据中(3)27个基因表达下降(占比50.00%),下降倍数为0.30~0.9627个基因表达上调(占比50.00%),上调倍数为1.01~6.46;其中18个基因变化值差异显著。将表2与表3GRAS基因按照增长倍数递增而排列,云麻1号与内蒙古小粒大麻中GRAS基因家族部分基因对照组(CK)表达量均为0,无法计算倍数,改为增加量(Cd–Ck)
表2 云麻1号GRAS基因表达
Table 2 Relative expression of GRAS genes in Yunma 1
 
 
*表示在0.05水平显著差异。*means significant difference at the 0.05 probability level.
表3 内蒙古小粒大麻GRAS基因表达
Table 3 Relative expression of GRAS genes in Inner Mongolia Xiaolidama
 
*表示在0.05水平显著差异。*means significant difference at the 0.05 probability level. 
2.6 两个大麻品种中同源基因对比及qPCR验证
 
9 GRAS同源基因表达
 
10 12个基因的qPCR验证表达
讨论
随着高通量测序技术的发展,越来越多的植物基因组完成了测序,而基因家族分析也成了育种方向挖掘基因功能有效的生物信息学手段。目前,WRKY、核苷酸结合位点基因家族(nucleotide binding siteNBS)MADS等基因家族在很多物种中都被鉴定出来,并进行了系统的研究与分析,而GRAS基因家族在各种作物中,尤其是各麻类作物中的研究还相对缓慢。
本研究从大麻基因组中鉴定出54GRAS家族基因,将拟南芥与大麻GRAS基因构建系统进化树后发现,有2个亚家族未包含拟南芥GRAS基因。通过系统进化树、基因结构与Motifs对比发现,CsGRASB亚家族中的CsGRAS5可归纳到SCL3亚家族,CsGRAS20CsGRAS22可能为CsGRAS25CsGRAS11演变得到,在演变过程中丢失了DELLA结构域,在大麦GRAS家族鉴定中也未发现含DELLA结构域的GRAS基因,表明DELLA结构域在不同物种间GRAS家族中的高度可变性。而CsGRASA亚家族虽然与HAM亚家族亲缘关系最近,但两者差异较大,无法合并为一个亚家族。故大麻GRAS基因一共鉴定出9个亚家族,其中CsGRASA亚家族是大麻新GRAS基因亚家族。
本研究通过对大麻染色体间GRAS家族基因进行共线性分析发现,PAT1SHRSCRPAT1HAMLISCL等不同亚家族间有共线性基因对,表明这些亚家族有染色体片段复制的相关性。而通过构建大麻、雷蒙德氏棉、大豆、水稻、玉米基因组GRAS共线性分析发现,PAT1LSSHRHAM在大麻、雷蒙德16氏棉、水稻中有直系同源基因,说明这些家族的保守性较强,而CsGRAS125种植物中都存在,属于SHR亚家族,表明其保守性最强,可能在单双子叶植物分化前就存在,且该基因在2个大麻品种镉胁迫下都上调表达,可作为后续研究的关键基因之一。而演化的过程中,GRAS家族在PAT1LISCLCsGRASA上又发生了大量基因的串联重复,这表明大麻GRAS的染色体片段复制与导基因串联重复是大麻出现54GRAS基因的关键步骤。
本研究将镉耐受性不同的2种大麻进行GRAS家族基因表达量比对发现,在镉胁迫下该基因家族表达量发生了明显的变化,表明镉胁迫会显著影响大麻GRAS基因表达。其中大部分GRAS基因在更耐镉胁迫的云麻1号中上调表达明显,表明GRAS基因家族与大麻的镉胁迫耐受性明显相关,上调大麻GRAS家族基因可能会提高大麻的镉胁迫耐受性。通过图82种大麻的形态对比发现,云麻1号在2种环境中形态未有显著差异,但内蒙古小粒大麻在镉胁迫环境下根系明显变短,而GRAS基因可以调控植物的根系生长及维管束的发育,推测是镉胁迫抑制了内蒙古小粒大麻部分GRAS基因表达而影响大麻根系的生长。其中CsGRAS48CsGRAS21CsGRAS36CsGRAS74个基因在云麻1号中表达上调,但在内蒙古小粒大麻中明显下调,推测其与大麻的根系发育有关。在植物激素方面,2DELLA基因:CsGRAS11CsGRAS25都表达下调,而DELLA基因负调控赤霉素途径,推测大麻在镉胁迫环境下增加赤霉素等植物激素以缓解外界的镉胁迫。而属于LISCL亚家族的CsGRAS39CsGRAS39在云麻1号中明显表达上调,在内蒙古小粒大麻中未发生变化,推测其为改变植物的光转导途径来应对外界的环境变化。将转录组中的12个基因进行qPCR验证发现,其中91.66%的基因变化趋势与转录组结果相同,表明转录组的结果较可靠。
结论
通过对大麻全基因组的序列比对,共获得GRAS家族54个成员,分属9个不同亚家族,具有典型的GRASDELLA保守结构域。通过生物信息学方法分析大麻GRAS家族的理化指标、系统进化关系、基因结构、共线性关系表明,染色体片段复制与串联重复复制对大麻形成54GRAS基因起重要作用,而转录组数据及qPCR验证都表明,GRAS基因与大麻应对镉胁迫有明显相关性,但其主要影响的代谢通路及不同基因之间的协同作用还需进一步研究。
 
文章摘自:尹明,杨大为,唐慧娟,潘根,李德芳,赵立宁,黄思齐.大麻GRAS转录因子家族的全基因组鉴定及镉胁迫下表达分析[J].作物学报:1-19[2021-02-17].

更多阅读