作者:隋月等   来源:   发布时间:2024-02-27   Tag:   点击:
[麻进展]基因家族鉴定技术在大麻中研究现状

 要:大麻(Cannabis sativa L.)作为一种拥有悠久历史和独特药用价值的栽培作物,长期以来受到1961年麻醉品单一公约的限制。然而,最近的法律法规调整使得大麻在研究和药用等领域的种植和应用逐渐放宽,为深入探究其科学特性和潜在应用开辟了新的可能性。本综述致力于全面介绍大麻基因家族的鉴定与生物信息学分析领域的最新进展,包括但不限于编码氨基酸数目、等电点、染色体定位、蛋白结构、基因结构、保守结构域、启动子区顺式作用元件以及在不同组织部位的表达情况等多个方面。通过对大麻基因的这些精细分析,为探究基因功能,加速大麻分子育种、遗传改良方面研究提供了依据。此外,这些研究还有助于加速大麻分子育种和遗传改良的进程,有望推动大麻在医学、工业和农业等领域的应用。本综述还探讨了未来大麻研究的潜在方向和重要性,为这一领域的进一步发展提供了有益的参考,展望了大麻在科学与应用之间的巨大潜力。

关键词:大麻;基因家族;生物信息学分析;基因功能

大麻(Cannabis sativa L.)是大麻科(Cannabaceae)的一员,是世界上古老的驯化作物之一(Long et al., 2017)。它起源于中亚地区,随后迅速传播到亚洲和欧洲。如今,全球各地都有大麻的种植。大麻的基因组是二倍体(2n=20),包括9对常染色体和1对性染色体(XY)组成,因此是典型的雌雄异株植物(张效霏和张利国, 2022),野生大麻基因组大小为812.5Mb(Gao et al., 2020)。根据四氢大麻酚(THC)含量将大麻分为工业大麻和毒品型大麻。工业大麻的THC含量<0.3%,而毒品型大麻的THC含量>0.3% (张利国, 2022)。大麻作为一种多用途植物被应用于各个领域,包括农业、食品、饲料、化妆品、建筑和制药行业(Piluzza et al., 2013; 张利国等, 2021; 张利国, 2023)。此外,大麻还可以用来制备纤维、刨花、生物建筑和保温材料,以及具有药理学意义的生物活性化合物(Irakli et al., 2019)。随着大麻应用范围不断扩大,市场潜力剧增,大麻遗传育种、分子育种等方面的发展刻不容缓,对大麻的研究也需要更深入。本综述撰写了大麻基因家族鉴定及生物信息学分析方面的应用进展,为探究基因功能,加速大麻分子育种、遗传改良方面研究提供了科学依据。

1基因家族鉴定与生物信息学分析技术

基因家族是一组基因,它们在结构和功能上表现出明显的相似性,通常编码相似的蛋白质产物。基因家族的鉴定在现代生物学研究中具有重要意义。它可以揭示出在研究物种中具有相似功能的基因的数量、保守性程度、变异特征,以及它们是否表现出特异性的表达模式。生物信息学分析是一门综合性的领域,包括了多个关键领域,如基因组分析、蛋白质结构分析、转录组分析等。在这些分析中,一系列技术和工具被用来获取有关基因和蛋白质的基本信息。

染色体定位分析可以了解基因在染色体上的位置,这对于研究基因组结构和组织非常重要。内含子/外显子分析有助于确定基因的基本结构,包括编码区域和调控区域。表达谱分析表明允许研究基因的表达模式,从而深入了解它们在不同条件下的功能。通过ORF (开放阅读框)分析,可以找到基因中编码蛋白质的区域,这对于蛋白质功能的理解至关重要。启动子预测、转录因子分析和CpG岛分析等技术则可用于识别转录调控区的顺式作用元件,从而为基因调控机制的研究提供了基础。

此外,通过对蛋白质的性质进行基本性质分析、疏水性分析、亚细胞定位、信号肽预测以及跨膜区预测,可以初步评估和预测基因编码蛋白质的性质,这对于指导实验研究方向具有重要的参考意义。基因家族鉴定与生物信息学分析技术的结合,为研究人员提供了深入探究基因与蛋白质的结构、功能和调控机制的工具,为生命科学领域的发展和创新提供了强有力的支持。这些技术的不断发展和应用,将继续推动对生物学中复杂现象的理解,可以期待在未来更深入地探索生命的奥秘,并将这些知识应用于解决人类面临的各种挑战,为医学、农业、生物工程等领域的应用提供更多可能性。

2纤维合成分析

WRKY转录因子是高等植物中最大的转录因子家族之一。在大麻(Cannabis sativa)基因组中,已成功鉴定出39CasWRKYs基因,分布于10条染色体上。这些基因的蛋白质长度在193~727氨基酸之间变化,而它们的基因结构表现出2~5个外显子和1~4个内含子的多样性。通过基因结构和系统发育分析,CasWRKY蛋白被分成了7个亚组。此外,CasWRKYs基因的启动子区域中含有较多与植物激素赤霉素相关的P-box元件,证明了13CasWRKY基因对赤霉素胁迫的响应。这些基因在大麻植株的茎的生长和纤维发育过程中扮演着重要角色(Wei et al., 2022)

阿拉伯半乳聚糖蛋白(fasciclin-like arabinogalactan proteins, FLAs)属于阿拉伯半乳聚糖蛋白(Arabinogalactan protein, AGP)超家族,参与了植物的生长、发育以及抵御非生物胁迫,尤其是在细胞壁合成过程中发挥着重要作用。通过对大麻基因组和EST数据库的分析,已鉴定出23CsaFLAs基因,并将其划分为4个类群。这些基因在植株不同部位表达差异明显,一些基因在纤维生长的早期阶段高度表达,而其他基因则更多地表达在茎的中部和基部,参与了次生细胞壁的形成。生物信息学分析揭示了CsaFLAs基因(包括FLA3FLA12FLA13FLA15FLA16FLA18FLA19)的启动子区域在老茎部位以较高水平表达,并且共享一个由MYB3 (属于MYB家族S4亚群的转录抑制因子)识别的motif,这表明在老茎和幼茎区域存在一个调控CsaFLAs基因表达的复杂转录调控网络(Guerriero et al., 2017)

水通道蛋白在植物中形成通道,有助于水、尿素以及硼和硅等元素的传输,对于控制作物的纤维长度具有重要作用。Guerriero(2019)通过分析已公开的基因组数据,首次确定了大麻的水通道蛋白基因家族,共鉴定出30个家族成员,分为五个亚家族(NIP, PIP, TIP, SIP, XIP)。其中,CsaNIP2-1蛋白与硅渗透性相关,并在花和茎中表达较高水平。

纤维素合成酶(cellulose synthase, CesA)在纤维素的合成过程中扮演着关键角色。郭蓉等(2022)对大麻中的纤维素合成酶家族成员进行了鉴定,总计鉴定出8个家族成员,分布在5条染色体上,这些蛋白质的长度在1044~1480氨基酸之间。它们的亚细胞定位显示均位于质膜上,表现出亲水性质,并与拟南芥中的同源基因家族存在一定的相似性。这个基因家族具有高度的保守性,除了CsCesA3之外,其余家族成员均含有较多的外显子,并且motif的分布基本一致。启动子区域包含多种与植物生长发育相关的顺式作用元件,例如光和逆境响应元件。进化分析结果表明,CsCesA1CsCesA6可能参与次生细胞壁的合成,而CsCesA7CsCesA8可能参与初生细胞壁的合成,从而影响植物的生长发育进程。

扩展蛋白(Expansin)通过调节植物细胞壁各组分之间的松驰度以及增强植物细胞壁的柔韧性,对植物的生长发育和环境抗性产生影响。大麻基因组中鉴定出32个扩展蛋白基因,这些基因分布在9条染色体上,并被分为EXPAEXPBEXLBEXLA四个亚家族。这些蛋白质的氨基酸数目在212~471之间,平均等电点为7.48,具有两个保守结构域,多数为疏水性蛋白质。它们的亚细胞定位显示位于细胞壁上,其启动子区域包含多种与植物生长相关的顺式作用元件,如光响应元件、种子特异性调控元件、根特异性调控元件和玉米醇溶蛋白代谢调控作用元件,表明它们在植物的生长发育过程中发挥着重要作用。

3开花过程中的生物信息学分析

CONSTANS-like (COL)基因家族在大麻的开花调控中扮演着关键角色。研究人员(Pan et al., 2021)成功鉴定出大麻基因组中的13CsCOL基因,这些基因的蛋白长度在184~507氨基酸之间变化。通过系统发育分析,发现CsCOL蛋白可以分为3个亚群,并且它们都包含着保守的内含子/外显子结构。这13CsCOL基因分布不均匀,分布在大麻的7条染色体上,其中第10号染色体上有最多的成员。这些基因的表达模式显示,有10CsCOL基因在叶片中优先表达,1个在茎中优先表达,而另外2个在雌花中表达较高。对于光周期的调控,大多数CsCOL基因表现出昼夜波动。在短日照处理下,CsCOL3在黑暗结束时表达量较高,而在长日照处理下,CsCOL7在白天12时达到峰值。进一步的序列分析表明,CsCOL3CsCOL7在早花品种和晚花品种中存在氨基酸差异,这使它们在光周期调控的开花途径中发挥着调节作用。

磷脂酰乙醇胺结合蛋白(phosphatidylethanolamine binding protein, PEBP)对于植物的生长发育,特别是营养生长向生殖生长的过渡,以及芽的生长和花结构的形态变化具有重要作用。陈晗等(2022)的研究对大麻基因组进行了全面的鉴定,共鉴定出12PEBP基因,分布在大麻的7条染色体上。这些基因都含有2个外显子,蛋白质长度在172~190个氨基酸之间变化,都属于亲水性蛋白。亚细胞定位分析显示这些基因均位于细胞核和细胞质中。系统进化分析将它们分为三个亚家族,具有高度保守性。这些基因的启动子区域富含光响应元件、脱落酸响应元件和茉莉酸响应元件等。当大麻受到外界胁迫时,这一基因家族可以调控植物的生长和开花。

MADS-box基因是一类能够调控植物生长发育和信号传导的转录因子,在花器官发育、开花时间的调节以及成花诱导中发挥着重要作用。大麻基因组中鉴定出了39MIKCMADS-box基因(CsMADS),它们的编码氨基酸数量在146~503之间,分布在大麻的9条染色体上,均定位于细胞核内。这些基因包含MADS的保守结构域,外显子的数量相对保守,大多在6~8之间。系统进化分析将它们分为14个亚类。在启动子区域中,这些基因含有丰富的光响应元件和脱落酸元件。不同组织中,CsMADS基因表现出特异性表达,参与了大麻花器官的发育。CsMADS7CsMADS12CsMADS29在雌花和苞片中的表达显著高于叶和茎,促进了雌花苞片表面的腺毛发育,从而有利于提高富含大麻素和萜类物质的树脂的生物合成和储存(万志庭等, 2021)

YABBY转录因子通过调控植物侧生器官远轴面细胞的分化,从而影响花和叶器官的生长。在大麻中,已成功鉴定出6YABBY家族成员(CsYABBY)。这些基因的编码氨基酸数量在185~235之间,分布在大麻的5条染色体上。所有这些蛋白都属于亲水性蛋白,含有2个保守的结构域,而内含子数量大多为6个。这些基因的启动子区域富含光响应元件和激素类响应元件。数据库和转录组数据分析表明,除了CsYABBY5之外,其他基因在花中的表达量明显高于叶片,其中CsYABBY4在花中表达最高,具有明显的组织特异性,并且对大麻雌花的发育起着重要的调控作用(孙嘉莹等, 2021)

4生长发育中的生物信息学

植物特异性同源域拉链家族(HD-ZIP)转录因子在植物的发育和环境适应中发挥着关键作用。其中,HD-ZIP转录因子IV (HDZ IV)主要调控植物表皮结构的发育,如气孔和毛状体。最近的研究(Ma et al., 2022)在大麻中鉴定了9个编码HDZ IV的基因,这些基因分布在大麻的5条染色体上,编码的蛋白质包含HDZ IV转录因子的保守结构域,蛋白质长度在737~841个氨基酸之间变化。亚细胞定位预测表明,这些蛋白质位于细胞核中。所有已鉴定的大麻HDZ IV基因的启动子序列都包含多种调控基序,如光和激素反应元件等。此外,不同的HDZ IV基因在根、茎、叶和花等组织中表现出不同的表达模式,其中CsHDG5 (XP_030501222.1)的表达与花的成熟度相关。

壁相关激酶(Wall-Associated Kinases, WAKs)是一类受体蛋白,它们能够结合细胞壁上的果胶或果胶小片段,参与植物细胞伸长和对病原体的反应。最新的研究(Sipahi et al., 2022)在大麻基因组中鉴定出53CsWAK/CsWAKL (WAK-like)蛋白家族成员,这些蛋白质的氨基酸长度在582~983之间,分子量在65.6~108.8 kDa之间。根据系统发育树的分析,它们可以分为四个类群,分布在大麻的6条染色体上。这些基因的启动子区域包含多种调控元件,涵盖了光响应、发育、环境应激和激素反应等不同的元件。特别值得注意的是,一些候选基因如CsWAK1CsWAK4CsWAK7CsWAKL1CsWAKL7在叶片组织中显示出特异的表达模式。

B3转录因子家族在植物种子的生长、发育和抗胁迫过程中发挥关键作用。最近的研究(Lu et al., 2022)对大麻中的B3基因家族进行了鉴定和分析。大麻B3家族总共包含65个成员,分布在10条染色体上,其等电点在10.03~4.65之间,分子量在99542.88~14310.9Da之间变化。大多数成员的亚细胞定位在细胞核中。这些基因的上游启动子区域含有多种与胁迫反应相关的顺式作用元件。CsB3基因在不同器官和不同类型的大麻雌性花序中表达呈现出差异,表明激素和外部环境因素可能影响CsB3的表达。其中,一些基因如CsB3-02CsB3-07CsB3-50CsB3-62CsB3-65可能参与大麻的生长发育,并在次生代谢产物的合成中发挥作用。

C2H2型转录因子在植物的次生代谢和生长发育中发挥重要作用。大麻中鉴定出30C2H2基因家族成员,它们分布不均匀在大麻的9条染色体上,氨基酸数量在138~635之间。通过系统进化分析,这些基因被分为10个亚家族,并且与拟南芥存在同源关系。这些基因家族成员中光响应元件数量最多,同时还包含脱落酸、赤霉素等作用元件。它们在不同的组织中表现出特异性表达,通过对Diku品种(Dinamed Kush CBD Autoflowering)的实时荧光定量PCR验证,结果显示CsC2H2-1CsC2H2-5CsC2H2-19在苞片中表达量最高,表明它们在大麻的生命活动过程中可能是关键的转录因子。而CsC2H2-24则在叶片中表达特异性,表明该基因主要调控叶片的生长发育(刘美琦等, 2021)

热激蛋白(Hsp20)在应对非生物胁迫以及植物的发育过程中发挥着作用。研究人员成功地从大麻中鉴定出35CsHsp20家族成员,这些蛋白的氨基酸长度在133~324之间,平均等电点为6.45。这些蛋白大多数定位在细胞质中,分布在大麻的9条染色体上,并被分为10个亚家族。它们的启动子区域包含多种激素等作用元件,表明它们可能参与大麻的生长发育。这些基因的表达水平在不同的组织中表现出特异性,尤其在大麻仁成熟期时,它们的表达量较高。

5胁迫与次生代谢

bZIP (Basic Leucine Zipper)基因家族在植物的生物和非生物胁迫响应以及次生代谢中扮演着重要角色。Lu(2022)共同鉴定了51个大麻bZIP基因家族成员,这些蛋白的长度在134~572之间,分别编号为CsbZIP1~CsbZIP51,它们分布在大麻的10条染色体上。通过系统发育分析,这些基因被归为11个亚家族。同一亚家族的CsbZIPs具有相似的内含子/外显子结构。这些基因的启动子区域包含多种调控元素,如脱落酸响应元件、厌氧诱导元件和茉莉酸甲酯响应元件等。通过qRT-PCR测定CsbZIPs在不同组织中的表达水平,研究结果表明CsbZIP2CsbZIP8在花、苞片和叶片中的表达量高于茎和种子,CsbZIP3在茎中表达水平较高,而CsbZIP15CsbZIP25CsbZIP32CsbZIP34CsbZIP405个基因在苞片中表现出较高的表达水平,CsbZIP14CsbZIP23在叶片中相对高表达。这些结果与转录组数据一致,有望为培育高大麻二酚和低四氢大麻酚大麻的优质品种提供指导。

另一项研究揭示了大麻bZIP基因家族成员的调控作用,特别是它们对植物油脂代谢的调控(怀浩等, 2022a; 2022b)。二酰基甘油酰基转移酶(DGAT)家族的成员在植物中催化三酰基甘油的生物合成中起着关键作用。研究人员对大麻DGAT (CsDGAT)基因家族进行了详细分析(Yan et al., 2023)。他们将10DGAT候选基因根据不同亚型特征分为4个家族(DGAT1, DGAT2, DGAT3, WS/DGAT)。这些蛋白的长度在327~556之间,分布在大麻的10条染色体上。CsDGAT家族成员的启动子区域包含大量调控元素,包括植物激素响应元件、光响应元件和胁迫响应元件等。这些基因在植物发育、环境适应以及非生物胁迫响应等关键过程中发挥重要作用。在低温胁迫条件下(4)CsDGAT基因在大麻幼苗的根和叶片中表达模式发生了变化。与未经处理的植株相比,幼苗的叶片中CsDGAT1CsDGAT2CsDGAT3基因在中后期显著上调(上调幅度大于2)。这种表达模式在根和叶组织中都是一致的,表明这些基因可能在大麻对低温的响应中起着正向调节作用。

GRAS (GAI, RGA, SCR)转录因子家族参与了植物的生长发育、逆境胁迫和信号转导等过程。一项研究(张苗苗等, 2021)对大麻中的GRAS基因进行了鉴定,共鉴定得到44GRAS基因,它们分布在大麻的10条染色体上,氨基酸数量在436~757之间。这些基因的序列具有高度保守性,并且主要定位在细胞核中。通过系统发育分析,这些基因被分为10个亚家族。它们的启动子区域含有脱落酸、茉莉酸甲酯等多种调控元素。CsGRAS基因在组织和品种中表现出明显的特异性。CsGRAS4CsGRAS13CsGRAS15CsGRAS17CsGRAS44可能参与大麻对逆境胁迫以及大麻素生物合成的调控。

2C类蛋白磷酸酶(PP2C)在植物的代谢产物合成和多种胁迫响应中发挥着调控作用。对工业大麻的PP2C基因家族进行鉴定后,共鉴定到52CsPP2C基因,这些蛋白的长度在244~1 089之间,主要定位在细胞核和细胞质中,且均含有2个以上的内含子。通过系统进化分析,这52个基因被分为10个亚家族,它们在进化上非常保守。这些基因的启动子区域包含脱落酸等顺式作用元件。它们在不同的组织中表现出差异的表达模式,例如,CsPP2C21在种子中表达水平较高,而CsPP2C41在苞片中表达较高(蔡晓雪等, 2022)。这些研究结果为深入理解大麻在胁迫响应和次生代谢中的分子机制提供了重要的信息。

6大麻素的合成

萜烯是大麻的气味和风味的主要来源,也直接或间接地影响着使用者的体验。一项研究(Allen et al., 2019)对大麻中的55个萜烯合成酶(TPS)基因进行了分析。从外显子结构来看,TPS家族表现出高度的保守性,被分为TPS-aTPS-bTPS-c三个亚家族,分别编码倍半萜、单萜和二萜合酶。基于组织特异性的基因表达分析,约45%TPS基因在花部样本中表达,约10%在根部表达。其中,TPS1TPS5TPS18TPS7TPS14等基因占TPS基因总表达量的70%,这些基因编码的酶参与合成D-柠檬烯、β-月桂烯和γ-桉叶油醇等萜烯物质。β-辛烯合成酶TPS6则是TPS-b亚家族中的一个根特异性合成酶,对培育特定萜烯品种具有重要的农艺意义,因此对TPS基因家族的深入了解对于大麻素合成具有重要意义。

组蛋白脱乙酰酶(HDACs)在植物生物学中扮演至关重要的角色,涉及胁迫响应、发育、生长以及次生代谢产物的生物合成调控。一项研究(Yang et al., 2021)挖掘了大麻中的14CsHDAC基因。这些基因的蛋白长度在203~504之间,分布在6条染色体上,被分为RPD3/HDA1SIR2HD2三个相对保守的亚家族。每个亚家族内外显子的数量相似,而每个家族成员的启动子区域都包含多个响应元件。例如,HDAC9含有许多光响应元件,可能对光刺激非常敏感。通过蛋白抑制剂Trichostatin A(TSA)的处理,可以有效抑制大麻中除了CsHDA10之外的所有CsHDAC基因的表达,这可能影响了大麻素代谢途径中前体物质的积累。

大麻二酚(CBD)的合成前体物质是大麻二酚酸(CBDA),而CBDA的关键合成酶是大麻二酚酸合成酶(CBDAS),主要由CBDAS基因编码。潘根等(2021)鉴定了大麻CBDAS基因家族的5个成员,分布在2号和7号染色体上。这些基因在氨基酸数量上相近,系统进化分析显示它们大多属于同一个亚家族。这些基因的启动子区域包含光响应元件等调控元素。这些CBDAS基因在不同组织中表现出明显的特异性表达。CsCBDAS1CsCBDAS2在雌蕊中表达较高,而CsCBDAS4CsCBDAS5在根中表达较高。这些基因家族也在受到重金属和光照等条件处理时表现出差异的表达水平,这些结果表明CBDAS基因家族参与了大麻素的合成以及大麻的生长发育。

LBD (Lateral organ boundaries)基因家族不仅调节植物的侧根和花序发育,还参与次生代谢的调控,是一种植物特有的转录因子家族。对大麻中的LBD基因家族的鉴定共得到了32个基因,这些基因的氨基酸数量在172~356之间。大多数基因定位在细胞核中,分布在大麻的10条染色体上,基因的结构相对保守。通过系统进化分析,这些基因可以分为7个亚家族。它们的启动子区域包含了激素等相关的作用元件。这些基因在不同组织中表现出不同的表达模式,花和茎中的表达较多,而叶片中的表达较少。其中,CsLBD21CsLBD23在花和茎中表达,而CsLBD8CsLBD18在花、茎和叶中都有表达。这些基因家族参与了大麻的生长发育,从而影响了大麻素的合成(王震等, 2020)

TIFY基因家族也在大麻中得到了鉴定,共鉴定到14个成员(CsTIFY1~CsTIFY14),它们的氨基酸数量在118~442之间。这些基因分布在8条染色体上,亚细胞定位显示它们都定位在细胞核中。这些基因包含2~10个内含子,通过系统发育分析,可以将它们分为4个亚家族:JAZZMLTIFYPPD。这些基因的启动子区域含有茉莉酸甲酯、低温等多种作用元件。它们在不同组织中表现出特异性的表达,例如,CsTIFY6在花、叶和苞片中表达较高,而CsTIFY1在茎中表达较高。这些基因的表达也受到不同品种和环境条件的影响。特别是TIFY转录因子家族的JAZ蛋白在大麻素生物合成中可能起着重要的调控作用,因为它们参与了茉莉酸信号通路的调节,影响了植物次生代谢产物的积累(温东等, 2020)

7黄酮醇合成分析

类黄酮化合物不仅对于植物生长和应对逆境胁迫至关重要,还在人类饮食和健康中扮演重要角色。最近的研究由Zhu(2022)从大麻中鉴定了11类编码关键酶的基因,共包括56个基因,这些基因参与了黄酮类化合物的生物合成,其中包括CsPAL1-7CsC4H1-2Cs4CL1-6CsCHS1-7CsCHI1-4CsFNS1-8CsF3'H1-3CsOMT6CsOMT12CsOMT21CsPT1-8CsF3H1-3CsFLS1-5。黄酮醇合成酶(Flavonoids Synthase, FLS)属于2-氧谷氨酸依赖的双加氧酶(2-ODD)超家族,它们催化二氢黄酮生成黄酮醇。这些酶的蛋白长度在332~364之间,亚细胞定位显示它们位于细胞质中,分布在3条染色体上。体外重组蛋白活性分析表明,CsFLS2CsFLS3具有将柚皮素转化为二氢山奈酚以及将二氢黄酮醇转化为黄酮醇的双重功能。同时,当以柚皮素为底物时,CsFLS2不仅产生了二氢山奈酚和山奈酚,还生成了芹黄素,这表明CsFLS2在大麻中与黄酮合成酶I有着密切的进化关系。

转录因子家族,包括bHLHMYB亚家族成员,对植物次生代谢途径的调控至关重要。Bassolino(2020)首次进行了大麻中bHLHMYB家族的全基因组分析。CsbHLH蛋白家族中有9个基因是单外显子,11个基因是单内含子,其余基因平均共用5个内含子。所有CsbHLH蛋白都具有高度保守的基序,通过Pfam分析,鉴定出了保守的PF14215.6特征,其中包括CsbHLH111-121,这表明这些bHLH蛋白可能参与了苯丙类化合物的合成调控。CsbHLH112CsbHLH113CsbHLH114与已知的与黄酮类相关的bHLH蛋白具有高度同源性,已被证明通过参与MYB-bHLH-WD40调控复合物的形成来调节花青素合成。此外,研究还发现了导致大麻类黄酮和大麻素合成的关键代谢途径的候选调控基因,如CsMYB82CsMYB87CsMYB45CsMYB39。此外,通过候选基因方法,还鉴定了编码结构酶的基因,这些酶参与了黄酮类化合物和大麻素的合成。

8其他方面

大麻同其他栽培植物一样,会受到各种威胁,包括白粉病等真菌性疾病,这些疾病可能降低大麻花蕾的质量,给农业经济带来严重损失。白粉病通常与Mildew Locus O (MLO)基因家族的分支IVV相关,这些基因分别与单子叶和双子叶植物的白粉病易感性有关。研究人员在五个不同品种的大麻基因组中鉴定了MLO基因家族的成员,数量在1417191818之间变化。该基因家族包含7个跨膜结构域、完整的MLO功能结构域以及特定的氨基酸位置。通过系统发育分析,确定了七个不同的进化分支(I~VII),研究人员从中筛选出白粉病易感性的候选基因,为培育抗白粉病的大麻品种提供了有力的依据(Pépin et al., 2021)

大麻籽中含有丰富的11S球蛋白(edestin),这是大麻籽中含量最高的蛋白质之一,其两个亚基的分子量分别在20~35 kDa之间。其次是2S白蛋白(Cs2S),其分子量约为14~15 kDa,而蛋白质丰度最低的是7S类邻近蛋白(Cs7S),其分子量约为47 kDa。研究人员对编码这三种贮藏蛋白的基因家族进行了分析,其中包括3edestin基因、2Cs2S基因和1Cs7S基因。通过氨基酸组成和结构分析,发现Edestin 1编码的蛋白具有最高的分子量,而Edestin 2编码的蛋白具有最小的分子量。这三种蛋白都富含精氨酸,而Edestin 3的蛋白则含有更高比例的蛋氨酸,这表明Edestin 3在营养价值方面具有优势。此外,不同品种的大麻在氨基酸组成和营养品质方面存在差异,这有助于进一步优化大麻品种的营养特性(Sun et al., 2021)。在另一项研究中,研究人员从大麻品种Carmagnola中分离出7个编码球蛋白的序列,这两种类型的球蛋白都表现出球蛋白的特征。这两种edestin基因在大麻种子的发育过程中都有表达,因此可以用于改善植物性食品的营养品质(Docimo et al., 2014)

9总结与展望

本研究深入探讨了大麻基因家族的鉴定和生物信息学分析技术的应用,涵盖了多个关键领域,包括纤维、开花、生长发育、胁迫及次生代谢、大麻素合成和黄酮醇合成等。这些研究不仅可以更清晰地了解了大麻的基因组成和多样性,还为深入理解大麻的生物学功能和潜在应用提供了基础。本研究仅仅是大麻基因家族研究的一个起点。进一步加强对已鉴定的基因家族成员的研究,包括基因功能的验证和解析。这可以通过基因过表达、基因沉默以及蛋白质相互作用研究等方法来实现,以深入了解这些基因在大麻植物的生长、发育和次生代谢中的具体作用。

大麻基因组仍然存在许多未知的领域,需要进一步挖掘。寻找并鉴定新的基因家族以及其成员,这将有助于扩展对大麻遗传多样性的理解。这些新发现的基因家族可能具有重要的功能,可以为大麻分子育种和优良品种选育提供更多的潜在目标。本研究为大麻基因家族的鉴定和生物信息学分析技术的应用提供了有力支持,未来的工作将在这一基础上不断深入,推动大麻研究领域的进一步发展。大麻的科学研究将有望为农业、医学、工业等领域的应用提供更多可能性,为人类福祉和健康做出更多贡献。


参考文献

[1] Allen K.D., Mckernan K., Pauli C., Roe J., Torres A., and Gaudino R., 2019, Genomic characterization of the complete terpene synthase gene family fromCannabis Sativa, Plos One, 14(9): e222363.

[2] Bassolino L., Buti M., Fulvio F., Pennesi A., Mandolino G., Milc J., Francia E., and Paris R., 2020, In Silico Identification of Myb and Bhlh Families Reveals Candidate Transcription Factors for Secondary Metabolic Pathways inCannabis Sativa L., Plants, 9(11): 1540.

[3] Cai X.X., Wang S.F., Mi Y.L., Wan H.H., Cao X., Sun W., Su C., Chen S.L., Xu Y.Q., and Chen W.Q., 2022, Identification and Expression Analysis of PP2C Gene Family Members inCannabis sativa, Zhongguo Shiyan Fangjixue Zazhi (Chinese Journal of Experimental Traditional Medical Formulae), 28(19): 162-172. (蔡晓雪, 王思凡, 米要磊, 万会花, 曹雪, 孙伟, 苏畅, 陈士林, 徐艳琴, 陈伟强, 2022, 工业大麻PP2C基因家族成员鉴定及表达分析, 中国实验方剂学杂志, 28(19): 162-172.)

[4] Chen H., Xu H.G., Wang Z.G., Xu W.H, Ge X.Q., and Qi H.Y., 2022, Identification and bioinformatics of PEBP family in Hemp, Fujian Nongye Xuebao (Fujian Journal of Agricultural Sciences), 37(8): 1016-1024. (陈晗, 徐洪国, 王志刚, 徐伟慧, 葛宵启, 祁宏英, 2022, 大麻PEBP基因家族鉴定及生物信息学分析, 福建农业学报, 37(8): 1016-1024.)

[5] Docimo T., Caruso I., Ponzoni E., Mattana M., and Galasso I., 2014, Molecular characterization of edestin gene family inCannabis Sativa L., Plant Physiology and Biochemistry, 84: 142-148.

[6] Gao S., Wang B.S., Xie S.S., Xu X.Y., Zhang J., Pei L., Yu Y.Y., Yang W.F., and Zhang Y., 2020, A high-quality reference genome of wildCannabis Sativa, Horticulture Research, 7(1): 73.

[7] Guerriero G., Deshmukh R., Sonah H., Sergeant K., Hausman J., Lentzen E., Valle N., Siddiqui K.S., and Exley C., 2019, Identification of the Aquaporin Gene Family inCannabis Sativa and Evidence for the Accumulation of Silicon in its Tissues, Plant Science, 287: 110167.

[8] Guerriero G., Mangeot-Peter L., Legay S., Behr M., Lutts S., Siddiqui K.S., and Hausman J., 2017, Identification of Fasciclin-Like Arabinogalactan proteins in Textile Hemp (Cannabis Sativa L.): In Silico analyses and gene expression patterns in different tissues, BMC Genomics, 18(1): 741.

[9] Huai H., Dong L.L., Ning K., Hou C., Dai F., Liu X., Wang J.Z., and Chen S.L., 2022a, Genome-wide identification of the Hsp20 gene family inCannabis sativa and its expression profile, Yaoxue Xuebao (Acta Pharmaceutica Sinica), 57(4): 1203-1215. (怀浩, 董林林, 宁康, 侯聪, 代飞, 刘霞, 汪鋆植, 陈士林, 2022a, 中药火麻仁基原植物Hsp20基因家族鉴定及表达分析, 药学学报, 57(4): 1203-1215.)

[10] Huai H., Ning K., Hou C., Yang S.M., Wang J.Z., Chen S.L., and Dong L.L., 2022b, The identification of bZIP gene family inCannabis sativa L.and its preliminary research of the function in regulation of lipid metabolism, Yaoxue Xuebao (Acta Pharmaceutica Sinica), 57(8): 2528-2542. (怀浩, 宁康, 侯聪, 杨树明, 汪鋆植, 陈士林, 董林林, 2022b, 火麻仁基原植物bZIP基因家族鉴定及其调控油脂代谢的功能初探, 药学学报, 57(8): 2528-2542.)

[11] Irakli M., Tsaliki E., Kalivas A., Kleisiaris F., Sarrou E., and Cook C.M., 2019, Effect of genotype and growing year on the nutritional, phytochemical, and antioxidant properties of industrial Hemp (Cannabis Sativa L.) Seeds, Antioxidants (Basel), 8(10): 491.

[12] Liu M.Q., Sun W., Meng X.X., Wan H.H., Liu T.X., Sun J.Y., Wang Z., Mi Y.L., and Ma W., 2021, Identification and expression analysis of the C2H2 gene family in Cannabis sativa L., Yaoxue Xuebao (Acta Pharmaceutica Sinica), 56(5): 1486-1496. (刘美琦, 孙伟, 孟祥霄, 万会花, 刘廷霞, 孙嘉莹, 王震, 米要磊, 马伟, 2021, 药用植物大麻C2H2基因家族鉴定与表达分析, 药学学报, 56(5): 1486-1496)

[13] Long T.W., Wagner M., Demske D., Leipe C., and Tarasov P.E., 2017, Cannabis in eurasia: origin of human use and bronze age trans-continental connections, Vegetation History and Archaeobotany, 26: 245-258

[14] Lu J.X., Sun J.Y., Wang Z., Ren W.C., Xing N.N., Liu M.Q., Zhang Z.P., Kong L.Y., Su X.Y., Liu X.B., and Ma W., 2022a, In silico genome-wide analysis of B3 transcription factors inCannabis Sativa L., Cannabis and Cannabinoid Research, 13: 168.

[15] Lu M., Meng X.X., Zhang Y.M., Zhu X.W., Li J., Chen W.Q., Wan H.H., Wang S.F., Cao X., Sun W., Mi Y.L., and Zhai J.W., 2022b, Genome-wide identification and expression profiles of Bzip Genes inCannabis Sativa L., Cannabis and Cannabinoid Research, 7(6): 882-895

[16] Ma G., Zelman A.K., Apicella P.V., and Berkowitz G., 2022, Genome-Wide Identification and Expression Analysis of Homeodomain Leucine Zipper Subfamily Iv (Hd-Zip Iv) Gene Family inCannabis Sativa L., Plants, 11(10): 1307.

[17] Pan G., Li Z., Yin M., Huang S., Tao J., Chen A., Li J., Tang H., Chang L., Deng Y., Li D., and Zhao L., 2021, Genome-wide identification, expression, and sequence analysis of constans-like gene family in cannabis reveals a potential role in plant flowering time regulation, BMC Plant Biology, 21: 142.

[18] Pan G., Tao J., Nie R., Zhou B., Huang S.Q., Chen A.G., Li J.J., Tang H.J., Li D.F., and Zhao L.N., 2021, Genome-Wide Identification and Expression Analysis of the CBDAS Cannabidiolic Acid Synthase Gene Family inCannabis sativa L., Hubei Nongxuebao (Acta Agriculturae Boreali-Sinica), 36(z1): 1-7. (潘根, 陶杰, 聂荣, 周兵, 黄思齐, 陈安国, 李建军, 唐慧娟, 李德芳, 赵立宁, 2021, 大麻CBDAS基因家族成员的全基因组鉴定及表达分析, 华北农学报, 36(z1): 1-7.)

[19] Pépin N., Hebert F.O., and Joly D.L., 2021, Genome-wide characterization of the Mlo gene family in Cannabis Sativa reveals two genes as strong candidates for powdery mildew susceptibility, Frontiers in Plant Science, 12: 729621.

[20] Piluzza G., Delogu G., Cabras A., Marceddu S., and Bullitta S., 2013, Differentiation Between Fiber and Drug Types of Hemp (Cannabis Sativa L.) From a Collection of Wild and Domesticated Accessions, Genetic Resources and Crop Evolution, 60(8): 2331-2342

[21] Sipahi H., Whyte T.D., Ma G., and Berkowitz G., 2022, Genome-Wide Identification and Expression Analysis of Wall-Associated Kinase (Wak) Gene Family inCannabis Sativa L., Plants, 11(20): 2703

[22] Sun J.Y., Wang Z., Mi Y.L., Meng X.X., Wan H.H., Yan Y., Sun W., and Ma W., 2021, Analysis on YABBY transcription factor family of original plantCannabis sativa of traditional chinese medicine cannabis fructus, Zhongguo Shiyan Fangjixue Zazhi (Chinese Journal of Experimental Traditional Medical Formulae), 27(5): 124-131. (孙嘉莹, 王震, 米要磊, 孟祥霄, 万会花, 闫赟, 孙伟, 马伟, 2021, 中药火麻仁基原植物大麻全基因组YABBY转录因子分析, 中国实验方剂学杂志, 27(5): 124-131.)

[23] Sun X., Sun Y., Li Y., Wu Q., and Wang L., 2021, Identification and Characterization of the Seed Storage Proteins and Related Genes ofCannabis Sativa L., Frontiers in Nutrition, 8: 678421

[24] Wan Z.T., Lu M., Wu S.S., Mi Y.L., and Zhai J.W., 2021, Identification and expression analysis of the MIKC-type MADS-box gene family inCannabis sativa L., Yaoxue Xuebao (Acta Pharmaceutica Sinica), 56(11): 3173-3183. (万志庭, 鲁梦, 吴沙沙, 米要磊, 翟俊文, 2021, 中药火麻仁基原植物大麻MIKCMADS-box基因家族鉴定与表达分析, 药学学报, 56(11): 3173-3183)

[25] Wang Z., Mi Y.L., Meng X.X., Wan H.H., Ji A.J., Sun W., and Ma W., 2020, Genome-wide analysis of LBD(lateral organ boundaries domain)gene family inCannabis sativa of traditional Chinese medicine hemp seed, Zhongguo Zhongyao Zazhi (China Journal of Chinese Materia Medica), 45(22): 5477-5486. (王震, 米要磊, 孟祥霄, 万会花, 季爱加, 孙伟, 马伟, 2020, 中药火麻仁基原植物大麻LBD基因家族成员的鉴定与表达分析, 中国中药杂志, 45(22): 5477-5486.)

[26] Wei H.W, Chen S.Y., Niyitanga S., Liu T., Qi J.M., and Zhang L.W., 2022, Genome-wide identification and expression analysis response to GA3 Stresses of WRKY gene family in seed hemp (Cannabis Sativa L), Gene, 822: 146290

[27] Wen D., Wang M.Y., Mi Y.L., Ma W., Sun W., and Shi Y.H., 2020, Genome-wide Identification and Characterization of TIFY Gene Family in Medicinal PlantCannabis sativa, Zhongguo Shiyan Fangjixue Zazhi (Chinese Journal of Experimental Traditional Medical Formulae), 26(24): 134-143. (温东, 王梦月, 米要磊, 马伟, 孙伟, 师玉华, 2020, 中药火麻仁基原植物大麻的TIFY基因家族鉴定及功能分析, 中国实验方剂学杂志, 26(24): 134-143.)

[28] Yan B.W., Chang C.Y., Gu Y.N., Zheng N., Fang Y.Y., Zhang M., Wang G.J., and Zhang L.G., 2023, Genome-wide identification, classification, and expression analyses of theCsDGAT gene family in Cannabis Sativa L. and their response to cold treatment, International Journal of Molecular Sciences, 24(4): 4078.

[29] Yang L., Meng X.X., Chen S.L., Li J., Sun W., Chen W.Q., Wang S.F., Wan H.H., Qian G.T., Yi X.Z., Li J.C., Zheng Y.Q., Luo M., Chen S.S., Liu X., and Mi Y., 2021, Identification of the histone deacetylases gene family in hemp reveals genes regulating Cannabinoids Synthesis, Frontiers in Plant Science, 12: 755494.

[30] Zhang L.G., 2022, CsBLH7 interacts with CsKNAT4 proteins to regulate elongation of hypocotyl cells, Jiangsu Nongye Kexue (Jiangsu Agricultural Sciences), 50(6): 41-44. (张利国, 2022, CsBLH7CsKNAT4蛋白互作调节下胚轴细胞的伸长, 江苏农业科学, 50(6): 41-44.)

[31] Zhang L.G., 2023, Subcellular localization and transcription activity analysis of CsKNAT3, Fenzi Zhiwu Yuzhong (Molecular Plant Breeding), 21(11): 3568-3571. (张利国, 2023, CsKNAT3亚细胞定位与转录活性分析, 分子植物育种, 21(11): 3568-3571.)

[32] Zhang L.G., Zhang X.F., Wang G.J., Zhang S.Q., and Chang Y., 2021, Research on AtATH1 transcription activity and immunoprecipitation analysis of interaction with AtOFP1 Protein, Fenzi Zhiwu Yuzhong (Molecular Plant Breeding), 19(20): 6747-6749. (张利国, 张效霏, 王贵江, 张树权, 常缨, 2021, AtATH1转录活性研究及与AtOFP1蛋白互作的免疫共沉淀分析, 分子植物育种, 19(20): 6747-6749.)

[33] Zhang M.M., Yu J.S., Shi J., Yang Y., Meng X., Sun W., Wan H.H., and Xue J.P., 2021, Study on GRAS transcription factors of cannabis genome, Zhongcaoyao (Chinese Traditional and Herbal Drugs), 52(5): 1423-1433. (张苗苗, 于江珊, 施江, 杨雨, 孟雪, 孙伟, 万会花, 薛建平, 2021, 大麻GRAS转录因子全基因组研究, 中草药, 52(5): 1423-1433.)

[34] Zhang X.F., and Zhang L.G., 2022, Research Progress on Male Sterility of Industrial Hemp, Xiandai Nongye Keji (Xiandai Nongye Keji), (8): 73-76. (张效霏, 张利国, 2022, 工业大麻雄性不育研究进展, 现代农业科技, (8): 73-76.)

[35] Zhu X..W., Mi Y.L., Meng X.X., Zhang Y.M., Chen W.Q., Cao X.W., Wan H., Yang W., Li J., Wang S.F., Xu Z.C., Wahab A.T., Chen S.L., and Sun W., 2022, Genome-wide identification of key enzyme-encoding genes and the catalytic roles of Two 2-Oxoglutarate-Dependent dioxygenase involved in flavonoid biosynthesis inCannabis Sativa L., Microbial Cell Factories, 21: 215.

 

文章摘自:隋月,张利国,房郁妍等. 基因家族鉴定技术在大麻中研究现状 [J/OL]. 分子植物育种, 1-9[2024-01-31]. http://kns.cnki.net/kcms/detail/46.1068.S.20231226.1148.006.html.


更多阅读