全球气候变暖已成为限制农作物产量的主要因素,严重威胁世界粮食安全。因此,从基因组进化角度解析耐热植物形成的生物学机制,以此为基础培育耐高温的农作物,可最大限度地提高农业生产力,从而满足日益增长的人口粮食需求。美洲狼尾草(Pennisetum glaucum [L.] R. Br., syn; Cenchrus americanus [L.] Morrone.),又名珍珠粟,是一种起源于非洲的多功能C4植物,为重要的饲用植物和杂粮类作物,具有优良的耐热性,是研究植物耐热机制的优良材料。
近日,四川农业大学和北京诺禾致源科技股份有限公司联合国内外多家机构在国际顶级期刊Nature Genetics杂志上发表了题为“Pangenomics identifies structural variation associated with heat tolerance in pearl millet”文章。研究团队组装了适应全球不同气候的10个美洲狼尾草代表性种质的高质量染色体序列,构建了图形泛基因组图谱(graph-based pan-genome),共鉴定了424,085个结构变异(Structural Variations, SVs),并揭示了结构变异对其优良耐热性的贡献。该研究整合了多组学分析并辅以基因功能验证,发现RWP-RKs类转录因子家族的扩张和SVs参与调控内质网(Endoplasmic Reticulum, ER)系统基因的表达改变,共同促进了美洲狼尾草优异耐热性状的形成。该研究提供了一个饲用作物全面且高质量的基因组资源,为农作物耐热性研究提供了新的见解,并为培育优质环境适应型作物奠定坚实基础。

美洲狼尾草耐热性形成的遗传机制
文章亮点:
1.首个美洲狼尾草图形泛基因组图谱揭示了结构变异调控ER系统基因的表达,促进美洲狼尾草耐热胁迫适应性演化。
2.首次发现RWP-RKs家族转录因子具备调控植物耐热性的新功能。
研究结果
美洲狼尾草基因组组装和泛基因组分析
该研究使用PacBio HiFi、BioNano、Hi-C和Illumina测序策略对从8个地区收集的394份美洲狼尾草核心种质中10份代表性材料进行染色体水平基因组组装 (图1a-b )。基因组大小在1.89~2.00Gb之间,scaffold N50值在193.80~286.98 Mb之间,为k-mer分析(1.97~2.01Gb)预估基因组大小的95.8%~99.47%,与流式细胞分析预估的基因组大小基本一致。与之前公布的美洲狼尾草参考基因组相比,contig N50值增加了155~3,959倍。
研究团队对新组装的10个基因组进行质量评估,Illumina高质量数据的比对率在95.62~99.57%之间,覆盖了94.92~99.90%的基因组。BUSCOs评估基因组完整度均大于91.60%,LAI值大于24,QV值大于40。以上指标说明,组装的美洲狼尾草基因组具有良好准确性、完整性和连续性。每个基因组平均被预测了36,847个蛋白基因,转座元件(TE)的含量为70.44~72.62% 。将这10个新组装的基因组与之前发表的1个基因组进行泛基因组分析,共获得14,608个核心基因家族,约占总基因家族的一半(46.60~52.08%),可变基因家族(39.75~49.94%)占比其次,特有基因家族所占比例最小(0.73~8.73%)(图1c)。对构建的泛基因组的代表性进行评估,结果显示所构建的泛基因组与394份核心种质在遗传多样性(π)、非同义突变率(dN)与同义突变(dS)比值、SNP密度均具有较高的一致性,这证明所构建的泛基因组具有较高的代表性,有助于美洲狼尾草的遗传改良。
图1. 美洲狼尾草高质量基因组组装和泛基因组分析
基于图形泛基因组的SVs鉴定
研究团队通过将PI537069基因组与其余10个基因进行比对,共鉴定了744,364个SVs,包括622,584个PAVs , 2,177个倒位(INVs),91,852个拷贝数变异(CNVs)和27,751个重排变异(TRANS)(图2a)。 将上述SVs进行合并,最终得到424,085个非冗余SVs。其中,PAVs占特有SVs的74.70 %,占非特有SVs的比例较高(87.51%),CNVs和TRANSs也存在类似的趋势 (图2b)。
此外,研究团队发现SVs更倾向于富集在重复区域(图2c ),37-44%的SVs位于基因和上下游区域(5kb)(图2d),表明SVs在基因调控中具有潜在功能。通过多个SVs检测软件、PCR实验及Illumina数据比对验证,均证明了所构建的图形泛基因组具有较高的质量,这是进一步研究美洲狼尾草SVs的重要前提。
图2. SVs鉴定
RWP-RKs转录因子家族的扩张有助于耐热性的形成
美洲狼尾草具有优良的耐热性(图3a)。为解析美洲狼尾草耐热性形成的分子机制,研究团队对多个物种进行比较基因组学分析。结果显示 ,美洲狼尾草中扩张的、正选择的、物种特异性的基因家族以及长末端重复序列(LTRs)附近的基因均在胁迫相关的通路中显著富集。其中,响应生物或非生物胁迫的转录因子(TF)家族( RWP-RKs )在美洲狼尾草中发生了扩张(图3b)。进一步研究表明,RWP-RKs家族的扩张可能与早期LTR的扩张有关,并引起了美洲狼尾草中特异RWP–RKs基因数量的增加(图3c,d)。
为探究RWP–RKs基因在植物响应高温胁迫中的功能,研究团队对高温处理后的叶片和根系进行了转录组测序分析,共鉴定到10个差异表达的RWP-RKs,包括2个特异性转录因子和8个非特异性转录因子。为进一步验证其功能,研究团队在水稻中过表达RWP-RKs (PMF0G00024.1)。结果显示,过表达该基因可显著增加转基因水稻的耐热性。同时,共调控网络分析和双荧光素酶验证分析结果均显示RWP-RKs TF可调控转录激活两个胁迫相关基因PMA2G00541.1和PMA6G02031.1,进而参与植物耐热性调控。综上所述,RWP-RKs TF基因家族的扩张对美洲狼尾草的耐热性具有重要的潜在贡献。
图3. RWP-RKs基因家族的扩张有助于美洲狼尾草耐热性的形成
RWP-RKs通过调控ER相关基因表达快速响应热胁迫
为了进一步解析美洲狼尾草耐热性形成的分子机制,研究团队对Tifleaf3基因型材料在8个高温处理时间点下的叶片和根系、6个基因型材料在胁迫1h和24h的叶片分别进行了转录组测序,并对差异基因(DEGs)进行功能富集分析。结果显示,DEGs主要富集于参与错误折叠蛋白修复和消除的ER相关通路中(图4a)。通过与发表的玉米和水稻的转录组数据进行联合分析,研究团队发现在热胁迫处理下,美洲狼尾草中ER相关基因和热激蛋白(HSF)基因表达上调的比例高于玉米和水稻(图4b)。
此外,研究团队还发现,RWP-RKs与大部分ER相关基因(60.19% ; 325/540)和HSFs(50.00%;16/32)在热胁迫条件下表现出显著的相关性(Pearson相关系数≥0.6, p值<0.05),表明RWP–RKs可能与ER相关基因和HSFs共同作用以调控美洲狼尾草的耐热性。对这些基因上游潜在的RWP-RKs结合位点进行预测分析,结果显示,与玉米和水稻相比,美洲狼尾草中ER相关基因具有更高比例的结合位点。瞬时共表达RWP-RKs转录因子(PMF0G00024.1)和两个ER相关基因BiP(PMA2G00107.1)和OST(PMA4G03758.1),进一步证实RWP-RKs可调控转录激活ER相关基因表达来发挥其功能(图4c)。以上结果表明,美洲狼尾草可能通过RWP-RKs在转录水平上调控HSFs和ER相关基因表达来快速响应热胁迫,以清除高温胁迫诱导产生的错误折叠蛋白(图4d)。
图4. 美洲狼尾草通过内质网相关途径响应高温胁迫
SVs与热胁迫相关基因表达相关
先前研究提出SVs能影响其附近基因的表达,为进一步探究SVs与美洲狼尾草耐热性的关系,研究团队对SVs附近热胁迫响应相关基因进行研究。结果显示,在所有材料中,位于SVs附近的基因对热胁迫反应更敏感(图5a,b),研究团队利用烟草瞬时表达进行了验证(图5c-e)。为研究SVs对热胁迫调控基因表达的影响,研究团队选择4个耐热材料(HR)和2个热敏感材料(HS)进行分析,共筛选出44个候选SVs可能与34个热胁迫基因表达变化相关。
根据RNA-seq数据,几乎所有基因(33/34)都响应热胁迫,其中11个基因(32.35%)在ER相关的通路中富集。以上结果说明了SVs在热胁迫调控中的潜在功能。研究团队进一步发现,在HR和HS组间存在差异的4个SVs附近的HSP70同源基因(PMA1G04478.1和PMA7G02533.1)和HSC蛋白(PMA5G02838.1)均在HR与HS间存在表达差异(图5g)。综上所述,这些SVs可能通过影响热胁迫响应基因的表达参与调控美洲狼尾草的耐热性。
图5. SVs对基因及美洲狼尾草耐热性的影响
SVs对美洲狼尾草驯化过程中热胁迫适应性的贡献
为鉴定美洲狼尾草中SVs在热胁迫适应过程中的贡献,研究团队以图形泛基因组为参考,对378个群体样品重测序数据(SRP063925)进行SVs检测,共鉴定了124,532个SVs。通过研究热带和温带种质间具有群体频率差异的SVs (fdSVs),共鉴定到269个选择消除区域,包含4,411个fdSVs,并注释到1,471个基因(图6a),其中包含27个ER途径相关基因。在SVs与基因表达相关的591个基因中,有25个基因的表达水平与fdSVs存在显著相关,并鉴定到一个响应热胁迫的ER途径的基因PMA2G02653.1上游存在一个fdSVs(图6a)。以上结果说明,与ER系统相关的SVs与美洲狼尾草热胁迫适应性相关。
为解析美洲狼尾草耐高温转变的驯化过程,研究团队利用上述美洲狼尾草群体(SRP063925)数据,相对于野生材料,在地方品种和改良品种中共鉴定出113个受选择区域,包含3,952个fdSVs和1,285个基因。功能富集分析结果表明,这些基因主要与胁迫相关,包括温度、非生物胁迫和类异戊二烯生物合成过程。该研究还发现79.30%的基因(1,019/1,285)转录水平发生变化,表明fdSVs可能影响热胁迫下的驯化基因表达。此外,16个fdSVs附近的基因中有17个仅在HR组中存在,并与其表达水平显著相关;PMA2G02653.1也与温度适应性相关(图6a).
此外,研究团队还发现了一个716bp的插入变异(INS)在野生品种中的比例高于地方品种和育成品种(图6b),该INS位于PMA5G03691.1基因上游2.1kb处。PMA5G03691.1编码一个卷曲螺旋90B-like蛋白,该蛋白参与花粉的萌发过程,并与穗粒数(GNP)性状相关。对GNP性状进行PAVs-GWAS和SNPs-GWAS分析,发现了在第五号染色体上存在PAVs和SNPs重叠的信号,并且PMA5G03691.1在该QTL附近(图6c)。此外,研究团队还发现,有INS存在的113份材料的穗粒数要低于没有该SVs存在的116份材料(图6c)。这些结果表明,这个INS在驯化过程中可能受到正选择作用,并影响附近基因对热的响应,可能有助于高温下生长的美洲狼尾草结种。此外,该研究还鉴定到142个PAVs与一个或多个性状(共20个性状)关联。这些结果为美洲狼尾草的分子育种提供了新的见解,同样证明基于图形泛基因组找到的SVs在美洲狼尾草耐热适应性和驯化过程中的重要作用。
图6. SVs有助于美洲狼尾草耐热适应性和驯化。
该研究由国内外多家单位研究人员共同协作完成。四川农业大学、佐治亚大学博士后严海东、四川农业大学博士孙敏、北京诺禾致源科技股份有限公司资深生信工程师张钟仁和四川农业大学博士靳雅荣为该论文的共同第一作者。四川农业大学草业科技学院黄琳凯教授和北京诺禾致源科技股份有限公司首席科学家田仕林研究员为论文的共同通讯作者。早在2019年黄琳凯教授就与诺禾致源科技股份有限公司合作首次公布了优质禾本科牧草鸭茅的高质量参考基因组,为我国第一个公布的牧草参考基因组,为鸭茅分子育种提供了重要的基础信息支撑。今年再次合作发布了首个牧草(美洲狼尾草)图形泛基因组,解析基因组结构变异在植物响应逆境胁迫中的重要作用。
目前诺禾致源在动植物研究方面累计完成的测序物种达500+,在作物、哺乳动物、水产及稀有生物等样本领域均积累了大量denovo、泛基因组分析经验。2023年,随着最新高通量PacBio Revio系统投产,诺禾致源将提供更多兼具长读长和准确性的HiFi测序数据,提供更加全面的基因组学测序及技术服务。







