分享一篇近期由海南大学王华锋教授团队发表在International Journal of Biological Macromolecules(IF=8.5,JCR1)上的文章:Machine learning and functional validation identify OsRAV11/12 as negative regulators of drought tolerance and early flowering in rice。研究通过机器学习与功能验证相结合,成功鉴定出OsRAV11/12为水稻干旱胁迫响应和开花时间的负调控因子,为理解植物胁迫与发育的交叉调控机制提供了新视角,也为耐旱作物育种提供了潜在基因资源。

研究背景与意义
- • 背景:水稻是全球一半人口的主食,但干旱胁迫严重影响其产量,严重时减产可达70%。气候变化将进一步加剧干旱频发,因此培育耐旱水稻品种对全球粮食安全至关重要。
- • 问题:尽管已有大量转录组数据,但传统分析方法难以从海量数据中准确识别关键调控基因。
- • 研究意义:本研究结合机器学习与功能基因组学,旨在高效筛选并验证调控水稻干旱响应的关键转录因子,为耐旱育种提供新靶点。
研究方法
- 1. 数据获取与处理
- • 收集并整合来自NCBI的9项独立研究的158个水稻干旱相关RNA-seq样本。
- • 使用HISAT2、featureCounts等工具进行基因表达定量与标准化。
- 2. 机器学习建模
- • 构建三种模型:随机森林(RF)、XGBoost、前馈神经网络(FNN),找出基因表达模式与抗旱性之间的隐藏关联。
- • 使用方差过滤和SelectKBest进行特征选择,最终选出20个最重要的基因。
- • 使用SHAP分析解释模型预测结果,识别关键基因。
- 3. 功能验证
- • 利用CRISPR/Cas9构建 OsRAV11/12 的双基因敲除(KO)突变体。
- • 构建过表达(OX)株系。
- • 对野生型(WT)、KO、OX植株进行干旱胁迫处理,评估其表型、生理指标(如气孔导度、ABA含量、MDA水平)及转录组变化。

主要研究结果
- 1. 机器学习模型表现
- • XGBoost表现最佳,测试集准确率达90%,AUC为0.97。
- • SHAP分析显示 OsRAV11 表达越高,干旱耐受性越差,提示其为负调控因子。



- 2. 功能验证结果
- • 表型:干旱条件下,KO植株存活率达80–85%,显著高于WT(57.5%);OX植株存活率仅15–20%。
- • 生理指标
- • KO植株ABA含量更高,气孔导度更低,氧化损伤(MDA)更少。
- • OX植株表现相反,干旱胁迫下更敏感。
- • 转录组分析
- • KO植株上调胁迫响应、蛋白折叠、ABA信号通路相关基因。
- • OX植株则上调生长相关基因,下调膜完整性和抗氧化相关基因。
- • 开花时间调控
- • KO植株开花提前,OX植株与WT相似。
- • KO中开花促进基因(如Hd3a、OsMADS14)上调,OX中则下调。



讨论与结论
- • 研究创新点
- • 首次结合XGBoost与SHAP分析,从转录组数据中高效筛选出关键调控基因。
- • 验证OsRAV11/12为水稻干旱耐受性和开花时间的负调控因子,拓展了RAV转录因子家族的功能认知。
- • 揭示OsRAV11/12通过调控ABA信号、氧化应激反应和开花相关基因,协调水稻生长与胁迫响应之间的平衡。
- • 应用前景
- • OsRAV11/12 可作为基因编辑靶点,用于培育耐旱、早熟水稻品种。
- • 本研究为利用人工智能解析复杂农艺性状提供了可推广的框架。
小编碎碎念
这是一个非常好的利用AI结合公共数据挖掘作物候选基因的例子!当然数据挖掘只是基础,解读数据包括通过可解释性模型筛选基因更关键。所以这个时代,做科研的都需要懂一点机器学习啊,不然拿到结果都看不懂。
如果童鞋们要系统入门基因组选择,近期中国农科院首席团队开设了一门理论与实践课程,详见:全基因组选择&智能设计育种全面升级,通过本文报名的朋友(扫以下二维码),课程结束后可联系小编免费加入“生物信息与育种”知识星球(价值199元),内含大量AI育种相关资源,欢迎一起交流学习。
