葡萄風味有奧秘,農科院用機器學習揭示基因漸滲過程

2023-07-02     CDA數據分析師

原標題:葡萄風味有奧秘,農科院用機器學習揭示基因漸滲過程

By 超神經

內容一覽:基因漸滲與葡萄的馴化、遺傳改良密切相關。先前研究揭示了歐洲栽培葡萄中,野生葡萄基因漸滲的基因組信號,但尚未深入研究這些漸滲事件發生的時間、方式、基因組模式和生物學效應。本文中,中國農業科學院深圳農業基因組研究所的研究人員,使用機器學習的種群遺傳分析方法,對栽培葡萄以及野生葡萄進行了重測序數據分析,這對於葡萄育種具有重要意義。

關鍵詞:基因漸滲 葡萄馴化 機器學習

作者 | daserney

編輯 | 三羊

基因漸滲是指基因從一種物種或種群,滲入到另一種物種或種群的過程。它通常發生在不同物種之間的雜交和回交過程中。在基因漸滲中,外源基因通過雜交進入目標物種的基因池,與目標物種的本地基因發生混合。 這種漸滲可以導致目標物種的基因組發生改變,獲得新的遺傳變異和多樣性。

葡萄的基因漸滲是指野生葡萄 (Vitis vinifera ssp. sylvestris) 與栽培葡萄 (V. vinifera ssp. vinifera) 之間基因交流和基因流動的過程。在自然界和人工選擇的影響下,野生葡萄與栽培葡萄之間發生基因交換,導致栽培葡萄中出現野生葡萄的遺傳特徵。

近期,中國農業科學院深圳農業基因組的研究人員,研究了馴化葡萄與其歐洲野生近緣種之間的漸滲歷史,他們使用基於機器學習的群體遺傳方法,揭示了葡萄風味的形成機制,對其基因特徵及其對葡萄育種的影響提供了深入的見解。 目前,該研究成果已發表在《Proceedings of the National Academy of Sciences》期刊上,標題為《Adaptive and maladaptive introgression in grapevine domestication》。

該研究成果已發表在《Proceedings of the National Academy of Sciences》期刊上

論文地址:

https://www.pnas.org/doi/abs/10.1073/pnas.2222041120

數據集

研究人員對一組 345 個測序樣本進行了分析,這些樣本包括釀酒葡萄和食用葡萄,涵蓋了野生葡萄的廣泛地理分布範圍,其中包括來自歐洲的 72 種野生葡萄 (V. vinifera ssp. sylvestris)、來自中東和高加索地區的 36 種野生葡萄和 231 種馴化葡萄 (V. vinifera ssp. vinifera),以及代表北美外群物種的 Vitis californica (n = 3) 和 Muscadinia rotundifolia (n = 3)。此外,研究人員還對歐洲野生葡萄進行了採樣以覆蓋歐洲和近東的預測分布區域。

數據 (基因組序列;) 已存放在 GitHub 中:

https://github.com/zhouyflab/Grapevine_Adaptive_Maladaptive_Introgression

實驗結果

基因漸滲歷史

首先,研究人員評估了歐洲野生葡萄、釀酒葡萄和食用葡萄之間的差異,以深入了解種群和馴化歷史。 值得注意的是,歐洲野生葡萄 (EU sylvestris) 形成了一個獨特的群體,與釀酒葡萄共享少數混合成分。

圖1. 不同葡萄品種對比

A:混合分析的系統發生樹。

在系統發生中,分支的顏色反映了不同的群體:ME 1,黃色;ME 2,紫色;野生葡萄,紅棕色;釀酒葡萄,藍色;食用葡萄, 綠色。Admixture 圖, K = 6 。圖右側的紅點和藍色三角形分別顯示來自食用或釀酒組的葉綠體或線粒體是否明顯起源於歐洲野生葡萄。

B:五個組的 PCA。

C:五組的雜合性。

D:不同傳播類型下的正向模擬結果。藍線表示異交繁殖,而橙色線表示克隆繁殖。

圖 1 顯示,釀酒葡萄和食用葡萄在進化過程中發生了早期的分化,表明它們在用途上有明顯的區別。野生葡萄樣本也呈現出單系群,但分為三個不同的群體:歐洲野生葡萄(EU)、位於裏海周圍葡萄 (ME 1) 和位於地中海附近的肥沃新月地帶的葡萄 (ME 2)。通過主成分分析 (PCA) 和祖先成分比例的估計,也證實了這些種群之間的分化。 釀酒葡萄和食用葡萄 (均為 0.24) 的雜合性比野生種群更高 (歐洲為 0.17,ME1 為 0.20,ME2 為 0.22),這可能是由於歷史上的漸滲事件和長期的無性繁殖導致了雜合突變的積累。

基因漸滲方向

研究人員在最初的模型基礎上,估計了食用葡萄、釀酒葡萄和歐洲野生葡萄之間可能存在的 34 種基因流動模式。 根據最佳模型,fastsimcoal 推斷歐洲野生葡萄大約在 4 萬年前發生了分化。

圖 2:漸滲檢測

水平分支中的時間 (T) 是每個組的分化時間 (年),T_i 表示推斷的漸滲開始時間。

底部的數字是每組的估計有效種群規模 (Ne)。

圖 2 顯示,在最佳模型下,fastsimcoal 推斷出 EU 類群在大約 4 × 104 年前分化;食用葡萄的馴化早在 1.5 × 104 年前就開始了;大約在 1.0 × 104 年前,釀酒葡萄從食用葡萄中分離出來。模型表明,歐洲野生種群和馴化種群之間的基因流動始於 1.8 × 103 年前。 此外,最佳擬合模型還表明,基因從歐洲野生種群流動到馴化種群的機率很高,向釀酒葡萄 (1.7 × 10−4) 的遷移率是食用葡萄 (3.8 × 10−5) 的 5 倍。

基因漸滲區域

研究人員使用機器學習方法來識別葡萄基因組的基因漸滲區域,以及這些區域的基因組特徵。

圖 3:漸滲區域的三種基因

Filet 預測的假定基因漸滲區域用黑線標記在 19 條染色體上。

三種顏色代表三種基因漸滲區域內的基因

紅色:開花相關基因

綠色:芳香化合物相關基因

藍色:應激反應基因。

研究人員對整個基因組中的漸滲選擇基因進行了 GO 功能研究, 並重點關注開花相關基因、風味相關基因和應激反應相關基因。圖 3 顯示,許多與開花相關的基因在滲入後選擇,其次是芳香族化合物相關的基因。大多數 GO 分類的富集也與風味相關,包括木質素降解過程、L-苯丙氨酸降解過程和肉桂酸生物合成過程。 因此,研究人員推斷釀酒葡萄和歐洲野生葡萄之間的適應性漸滲主要影響了與風味相關的性狀。

為了解等位基因的漸滲動態, 研究人員對異交繁殖和克隆繁殖的漸滲進行了正向模擬。

圖 4:非漸滲區域和漸滲區域中有益SNPs和有害SNPs的SFS

E:整個漸滲群體中漸滲等位基因的總數

F:整個漸滲群體中不同類型的漸滲等位基因的數量

G:異交組第 500 代漸滲有益和有害等位基因的 SFS

H:克隆組第 500 代漸滲有益和有害等位基因的 SFS

研究發現,雜交後漸滲等位基因 (包括有益和有害等位基因) 的總數都有所增加,直至達到平衡。這些模擬表明,在克隆和異交系統中,漸滲等位基因的情況可能存在顯著差異。漸滲對有益和有害變異的補充起到了重要作用,這些變異可能成為葡萄栽培基因組設計的主要目標,包括在有性繁殖過程中清除潛在的有害變異。

AGIS:專注農業科技創新

值得注意的是,該論文的多名作者均來自中國農業科學院深圳農業基因組研究所。基因組所成立於 2014 年,通過整合生物學和大數據科學,來認識與利用農業生物基因組,服務全球農業生產。 基因組所的長期願景是致力於通過顛覆性創新來促進全球農業可持續發展,服務於個性化食品供給體系,並提升人類健康水平和農民社會地位。

基因組所在包括 Science、Nature、Cell 等頂級期刊在內的雜誌上發表 SCI 論文 620 多篇,農業基因組學等研究領域占據世界前沿。除了研究葡萄的基因漸滲問題,該所還發布了另外兩篇與葡萄基因相關的研究成果,不僅聯合國內外學者首次繪製了葡萄完整基因組圖譜,還揭示了野生葡萄的抗皮爾斯病的全基因組效應和氣候適應性機制。

所長表示,基因組所還是一個非常年輕的科研院所,建設國際一流的農業科研院所任重而道遠,將立足新時代新征程新使命,以堅持「四個面向」助力高水平科技自立自強,為建設「農業強國」繼續做出我們的貢獻。目前,基因組所聯合深圳市相關部門提出了建設「深圳國際食品谷」建議,規劃已得到市政府批覆, 將在深圳構建農業食品產學研協作生態,做出科技推動農業食品產業轉型升級的先行示範。

文章來源: https://twgreatdaily.com/zh/215c8954316eb4209a1ba22ab0f893f1.html