首個近完整黃瓜參考基因組及多組學綜合資料庫發布

2024-06-25   澎湃新聞

近日,中國農業科學院蔬菜花卉研究所葫蘆科蔬菜遺傳育種創新團隊在黃瓜基因組學方面取得重要進展,首次完成接近完整的黃瓜參考基因組組裝和基因注釋,搭建了第一個黃瓜多組學綜合資料庫。相關研究成果發表在《分子植物(Molecular Plant)》(IF5 year = 21.4)上。

黃瓜(Cucumis sativus L.)是葫蘆科(Cucurbitaceae)的重要經濟蔬菜作物。黃瓜基因組中有近30 %的區域是由45s rDNA和微衛星等複雜重複序列組成的,這個比例遠高於水稻、玉米和西瓜等作物(< 5%),並且受當時測序技術及組裝方法的限制,目前廣泛使用的華北密刺型(『ChineseLong』)黃瓜自交系『9930』參考基因組(CLv3.0版本)仍然有大量未知序列(~130 Mb)和72個缺口;與此同時,這些重複序列也嚴重影響基因注釋的準確度,黃瓜參考基因組質量亟待提高。

CLv4.0和CLv3.0基因組序列比較

為此,該研究首次採用ONT+HiFi+HiC的策略,獲得了僅剩1個缺口的黃瓜參考基因組近完成圖(CLv4.0);基於大規模三代全長和二代轉錄組數據,構建了接近完整的黃瓜參考轉錄本數據集(CsRTD1),BUSCO值達99.19%;整合泛基因組、群體變異組、轉錄組以及核心種質材料信息,搭建了第一個黃瓜多組學資料庫Cucumber-DB(http://www.cucumberdb.com/),可為黃瓜功能基因組學和分子育種研究提供全面的共享平台。

黃瓜參考轉錄本數據集構建及評估

黃瓜多組學資料庫Cucumber-DB介紹

該研究得到蔬菜生物育種全國重點實驗室、國家重點研發計劃、中國農業科學院科技創新工程項目以及國家現代農業產業技術體系等項目的資助。