2024年11月29日,扬州大学徐辰武教授团队和北京大学现代农业研究院徐云碧博士联合在Plant Communications在线发表了题为Metabolic marker-assisted genomic prediction improves hybrid breeding的研究论文,提出了一种代谢标志物辅助基因组预测的新策略,通过整合从亲本群体代谢组关联研究(MWAS)中预选的显著代谢物,提升杂交种表型的预测力,为玉米和水稻等杂种优势利用作物的新品种选育提供了重要技术支撑。
全基因组选择(GS)育种技术是在得到个体基因型时即可对其育种值进行评估,能够大幅度缩短育种周期,提高育种效率。特别是在玉米和水稻等作物的杂交种育种中,由于杂交种的基因型可以直接通过亲本基因型推断,减少了杂交种基因型检测成本,GS的优势更加明显。但在实际育种中,GS的成功与否在很大程度上取决于基因组预测的准确性。由于GS难以捕获基因的复杂互作及其下游调控,对于一些复杂性状,尤其是受环境影响较大的产量性状,面临预测准确性难以提升的瓶颈问题。本研究提出了一种代谢标志物辅助基因组预测方法(MM_GP)。首先,使用LASSO方法进行代谢组关联分析,检测到与玉米自交系的穗重(EW)、穗粒重(EGW)、穗粗(ED)和穗长(EL)显著相关的代谢物分别为30、28、31和24个(图1)。然后,分别采用GBLUP和XGBoost两种GS方法将鉴定到的显著代谢物整合到杂交种基因组预测模型中,进行杂交种表型预测。
与基因组预测(GP)相比,MM_GP显著提高了玉米杂交种四个性状的预测力(图2)。使用GBLUP时,MM_GP分别将穗重、穗粒重、穗粗和穗长的预测力提高了4.1%、5.3%、0.8%和2.7%;使用XGBoost时,MM_GP则分别将这些性状的预测力提高了5.2%、4.4%、4.2%和9.7%。此外,仅利用与三个以上性状显著相关的六个代谢物与基因组数据结合,也能够提高预测力(图3)。MM_GP的预测力可以达到甚至超过基因组-代谢组的整合预测(M_GP)。
图2 5种预测模型、2种统计方法(GBLUP和XGBoost)对玉米杂交种4个性状的预测力
图3 玉米自交系中3个以上性状显著相关的代谢物辅助基因组预测的预测力
为了进一步验证MM_GP的功效,对一套公开发表的水稻数据集进行了分析。结果表明,与GP相比,使用GBLUP时,MM_GP对水稻杂交种单株产量(YIELD)、分蘖数(TILLER)、每穗粒数(GRAIN)和千粒重(KGW)的预测力分别提高了37.5%、13.6%、15.4%和2.6%;使用XGBoost时,MM_GP对单株产量、分蘖数和每穗粒数的预测力也有显著提升;此外,对于单株分蘖数、每穗粒数和千粒重这三个性状,MM_GP的表现均优于M_GP(图4)。
图4 5种预测模型、2种统计方法(GBLUP和XGBoost)对水稻杂交种4个性状的预测力
该研究证明了MM_GP策略在玉米和水稻等主要作物杂交种预测方面的优势。随着高通量组学技术和预测模型的不断发展,该策略有望进一步提高杂交种表型预测的准确度。扬州大学农学院徐辰武教授和北京大学现代农业研究院徐云碧博士为该论文的通讯作者。扬州大学徐扬副教授、博士生杨文艳和上海师范大学邱杰副研究员为该论文的共同第一作者。扬州大学的杨泽峰教授和国际玉米小麦改良中心的张学才研究员对该工作提供了帮助。该工作得到了国家重点研发计划、国家自然科学基金、江苏省种业振兴“揭榜挂帅”项目及河北省科技计划等项目的资助。