近日,河南省农业科学院花生育种团队在花生基因组研究领域取得重要突破,相关研究成果以“A telomere-to-telomere genome assembly of the cultivated peanut”为题发表在国际著名期刊《Molecular Plant(分子-植物)》上。该研究报道了首个花生栽培品种远杂9102基因组的T2T(telomere-to-telomere)组装,揭示了花生基因组的结构特征和进化历程。这一重要成果为花生基因功能研究和遗传改良提供了重要理论依据。
已有的花生栽培种参考基因组来自不同品种,如'Tifrunner'、'Shitouqi'和'Fuhuasheng',这些基因组的组装结果显著推动了花生遗传学和育种工作的发展。但这些基因组仍存在着不同大小的缺口,尤其是在一些具有重要生物学的区域,如着丝粒和端粒,阻碍了对这些区域的功能和进化意义的研究。为了填补这些缺口,科研团队结合了PacBio HiFi、超长ONT、Illumina和HiC测序数据,首次成功实现了花生四倍体栽培种(Arachis hypogaea L., 2n=4x=40)的完整基因组组装,该组装结果覆盖了所有20个着丝粒和40个端粒区域。通过进一步利用PacBio HiFi转录组测序数据,花生基因注释的准确性得到了提升。与Tifrunner参考基因组相比,该基因组包含了123.2Mb的新序列,其中含有1672个编码蛋白的基因。
科研团队利用PSMC分析发现,花生的A亚基因组(subgenome A, subA)和B亚基因组(subgenome B, subB)都在大约4000年前发生了有效群体的扩张,这一时间点与最早发现的花生时间相吻合,暗示了该时间可能是花生栽培种四倍化事件发生的时间。进一步对着丝粒区域的研究发现,subB上该区域的重复序列高于subA,但subB上年轻重复序列的比例较少,这表明较慢的重复序列清除速度,而非更多的重复序列插入,是导致subB上该区域重复序列含量更高的原因。此外,subA的着丝粒区域较subB包含了更多的串联重复基因,这些基因的功能主要与蛋白质折叠和运输相关,其育种方面的意义有待进一步挖掘。
通过对花生基因组的共线性分析,科研团队探究了花生从二倍体野生种(A. duranensis和A. ipaensis)到四倍体栽培种(A. hypogaea L.)的演化过程。分析结果表明subA和subB的大部分区域保持高度的共线性,但也发生了多次的同源交换事件。通过分析同源基因间的选择压力,研究发现花生基因组在演化过程中发生了选择压力放松的情况,这一结果表明花生的演化过程可能伴随着同源基因间的功能分化。
本研究是河南省农业科学院花生育种团队继揭示花生遗传驯化历史和表型分化的遗传机制(Nature Genetics,2024)之后取得的又一重要成果。王晓波博士、孙子淇副研究员和齐飞艳副研究员为该论文共同第一作者,张新友院士和郑峥研究员为论文的通讯作者。本研究得到了国家重点研发计划、神农种业实验室一流课题、河南省重大科技专项、国家花生产业技术体系、河南省花生产业技术体系、河南省农业科学院杰出青年基金等项目的资助。