首个近完整黄瓜参考基因组及多组学综合数据库发布

2024-06-25   澎湃新闻

近日,中国农业科学院蔬菜花卉研究所葫芦科蔬菜遗传育种创新团队在黄瓜基因组学方面取得重要进展,首次完成接近完整的黄瓜参考基因组组装和基因注释,搭建了第一个黄瓜多组学综合数据库。相关研究成果发表在《分子植物(Molecular Plant)》(IF5 year = 21.4)上。

黄瓜(Cucumis sativus L.)是葫芦科(Cucurbitaceae)的重要经济蔬菜作物。黄瓜基因组中有近30 %的区域是由45s rDNA和微卫星等复杂重复序列组成的,这个比例远高于水稻、玉米和西瓜等作物(< 5%),并且受当时测序技术及组装方法的限制,目前广泛使用的华北密刺型(‘ChineseLong’)黄瓜自交系‘9930’参考基因组(CLv3.0版本)仍然有大量未知序列(~130 Mb)和72个缺口;与此同时,这些重复序列也严重影响基因注释的准确度,黄瓜参考基因组质量亟待提高。

CLv4.0和CLv3.0基因组序列比较

为此,该研究首次采用ONT+HiFi+HiC的策略,获得了仅剩1个缺口的黄瓜参考基因组近完成图(CLv4.0);基于大规模三代全长和二代转录组数据,构建了接近完整的黄瓜参考转录本数据集(CsRTD1),BUSCO值达99.19%;整合泛基因组、群体变异组、转录组以及核心种质材料信息,搭建了第一个黄瓜多组学数据库Cucumber-DB(http://www.cucumberdb.com/),可为黄瓜功能基因组学和分子育种研究提供全面的共享平台。

黄瓜参考转录本数据集构建及评估

黄瓜多组学数据库Cucumber-DB介绍

该研究得到蔬菜生物育种全国重点实验室、国家重点研发计划、中国农业科学院科技创新工程项目以及国家现代农业产业技术体系等项目的资助。