當前位置:首頁 > 技術交流 > 最新應用

技術交流

掃描二維碼
或添加“GeneGroup003
獲取更多更新資訊

商城訂購

掃描二維碼
或添加“基因商城(GeneMart)
手機下單,快人一步

售后服務

掃描二維碼
或添加“GeneGroup005
獲取更快速售后支持

泛基因組經典文章回顧——PacBio SMRT助力大豆泛基因組研究,打開遺傳變異分析新思路

版權所有,轉載請聯系基因市場部
2021-09-01

“工欲善其事,必先利其器”

PacBio 三代測序技術可以獲得長讀長且準確的序列,可鑒定出短讀長測序技術無法識別的長片段遺傳變異信息,成為泛基因組組裝的一大利器。

大豆是國家重要的糧食經濟作物,為人類提供了主要的油料和蛋白資源。目前,被廣泛應用的參考基因組有三種:Williams 82、Zhonghuang 13、W05。通過對三種參考基因組的比較,發現大量結構變異,比如獲得與缺失變異(PAVs,presence/absence variants)和拷貝數變異(CNVs,copy number variants),導致單一或少數基因組不能完全代表一個物種所有的遺傳變異。因此需要構建能夠廣泛代表不同大豆品種的泛基因組。


Cell文章—植物泛基因組

圖片

中國科學院遺傳與發育生物學研究所田志喜研究團隊長期從事大豆功能基因組研究,2020年7月9日在Cell上發表了題為Pan-Genome of Wild and Cultivated Soybeans的文章,通過PacBio長讀長測序技術對26份具有代表性的野生和栽培大豆的基因組進行從頭組裝,構建了一個高質量的大豆圖形結構基因組,并進行泛基因組分析,發現了大量通過短讀長測序技術沒有發現的遺傳變異,有助于識別與農藝性狀相關的候選基因。


圖片


 樣本選擇策略

為了構建能代表大豆全部遺傳多樣性的泛基因組,作者對2898份大豆樣本進行illumina 13×測序(2898份大豆樣本中包括103份野生大豆、1048份農家種和1747份栽培品種,并在全球范圍內收集,代表了大豆地域分布),與參考基因組Gmax_ZH13比對,鑒定出31,870,983個SNPs,通過SNP構建系統發育樹,結合地域分布進行分析,挑選出最能代表2898份材料,以及對生產和育種有較大貢獻的26份大豆樣本,包括了3份野生大豆,9份農家種和14份栽培品種,進行泛基因組的構建。

圖片

圖1.2898份重測序大豆材料的地理分布及系統發育分析

A.2898個品種的地理分布。各地區收集的材料數量用餅圖的大小表示,各地區野生大豆(紫色表示)、農家種(綠色表示)、栽培品種(橙色表示)的比例在餅中顯示。每個國家或地區的大豆種質資源總數以藍色深度表示。

B.根據全基因組SNPs推斷得出的系統發育樹。不同顏色的線條代表不同的種類,野生大豆(紫色)、農家種(綠色)、栽培品種(橙色)


● 測序策略

對挑選出來的26個大豆樣本進行PacBio 單分子實時(SMRT,single molecule real-time)測序,平均深度為96X;結合平均深度為277X的Bionano 光學圖譜數據和染色體構象捕獲(Hi-C)以及illumina 測序數據,進行了全基因組組裝和注釋。所得到的contig N50平均長度達22.6M,scaffold N50平均長度達51.2M,組裝的基因組大小平均長度達1011.6M。

圖片

表1.26個大豆基因組的組裝與注釋綜述


● 泛基因組分析

對26份大豆樣本和zhonghuang13參考基因組進行泛基因組分析,從圖2(A)中可以看出隨著基因組數目的增加,泛基因組中的基因數量也隨之增加,當基因組數目達到25個時,基因數目增加到平臺期。因此由這27個基因組所構建的泛基因組可以覆蓋大豆所有的基因。根據基因在27份泛基因組中存在的頻率定義出Core Genes(存在27份樣本中)、Softcore Gene(存在25-26份樣本中)、Dispensable Genes(存在2-24個樣本中),Private Gene(僅存在單個樣本中),結果比例如下圖。雖然Dispensable Gene和Private Gene的個數多,但是在單個樣品中比例不高??梢钥闯鯟ore Gene和Softcore Gene在50%左右,Dispensable Gene為50%左右(如圖2B-2D)。Core gene有更高的domain比例,同時π和dn/ds也比較低,說明Core Gene更保守(如圖2E-2F)。

圖片

圖2.27份大豆樣本的泛基因組和核心基因分析

A.隨著大豆樣本數量的增加基因家系中泛基因組和核心基因的變化;B.泛基因組和個體基因組的組成;C.27個大豆基因組中泛基因組的存在與缺失信息;D.個體基因組中各成分的基因數;E.Core、softcore、dispensable、private 基因中具有InterPro domains的基因比例;F.Core、softcore、 dispensable、private 基因中核苷酸多樣性(π)和dN/dS的比例。


● 構建圖形結構基因組并分析結構變異

作者認為如果構建多個泛基因組而不進行下一步的整合將無法打破不同個體之間遺傳多樣性的瓶頸。因此,他們首次嘗試基于圖形結構將不同的泛大豆基因組整合成為一條完整的泛基因組,打破了傳統線性基因組的儲存形式。

作者將29個大豆樣本(26個denovo組裝和Williams 82、Zhonghuang 13、W05)的基因組整合成一條圖形結構基因組(graph-based genome),將鑒定到的776,399個SVs進行合并成124,222個非冗余SVs。與核心基因組的定義思路相似,按照SVs在不同樣本中出現的頻率定義為Core 、softcore、Dispensable,private gene。研究中發現Wm82有較高比例的private SVs,作者認為這種情況可能是用二代測序技術組裝的原因。同時發現SVs更傾向于存在DNA重復的區域。比以往發現了更多的PAVs,78.5% 的PAVs都來自DNA重復區域。作者將2898個大豆重測序數據比對到graph-genome上,共鑒定到55,402個SVs。從2898份材料中鑒定到3584個新的SVs,野生大豆中鑒定到的SVs要明顯多于地方種和栽培種?;趫D形結構基因組分型的SVs對種子光澤進行的全基因組關聯研究(GWAS),確定了15號染色體上的一個重要信號,其中一個10 kb的PAV導致了一個疏水蛋白(HPS)編碼基因的存在和缺失,進一步分析含有和不含有這10 kb序列的大豆種子分別具有較高比例的光澤和無光澤,這表明PAV可能是控制大豆種子光澤變化的因果遺傳變異之一。


圖片

圖3.29份大豆基因組和2898份重測序樣本的遺傳變異

A.29份大豆基因組和2898份重測序樣本的遺傳變異分布;B.隨著樣本數量增加,樣本中的變異數量的變化。(以非冗余策略進行合并);C.每個樣本中不同類別的變異的數量;D.重復和非重復區域中結構變異的密度;E.DNA重復區域的數量與結構變異數量的關系;F.等位基因的頻率與結構變異數量的關系。結構變異是通過將短讀長測序比對到圖形結構基因組上檢測出的;G.從野生大豆,農家種和栽培品種中發現的新SVs的數量;H.基于圖形結構基因組進行GWAS測序;I.一個編碼疏水蛋白(HSP)的10kbPAV;J.10 kbPAV的兩個單倍型種子光澤變異的比較.


● PacBio 強勢助力泛基因組研究

HiFi 測序是PacBio測序平臺推出的兼顧長讀長和高準確度的測序技術。作為PacBio最新的數據類型,既兼顧讀長(20kb的長度)又具有高準確度(>99.9%準確率)的HiFi reads,不僅可以改善變異檢測,減少組裝時間,還能夠識別復雜的基因組區域的細微差別,有助于增加基因組組裝的連續性,準確性和完整性,可以實現多倍體基因分型。在泛基因組研究中可以提供高質量的參考基因組,同時可以有效節約生信分析的時間,大大加速大型泛基因組研究的效率。

從待研究物種群體中選擇具有足夠遺傳多樣性的代表來捕捉大部分變異,通常20-30品系可以完成該工作。然后對這20-30個品系進行全基因組測序以及全長轉錄組測序,從基因組層面和轉錄組層面打造高質量參考基因組。接著就可以在剩余的物種內進行低覆蓋率的重測序,以進一步分類每個品系并捕獲全部的變異。


參考文獻:Liu Y ,  Du H ,  Li P , et al. Pan-Genome of Wild and Cultivated Soybeans[J]. Cell, 2020, 182(1).


更多資訊請點擊:

  1. HiFi reads,泛基因組時代的引擎

  2. PacBio HiFi測序在作物鴉類進化的泛基因組研究

  3. PacBio SMRT測序技術助力開啟泛基因組研究新時代

  4. 泛基因組經典文章回顧——PacBio SMRT助力揭示水稻基因組中的“隱藏”變異

  5. 細數近期PacBio HiFi測序的高分文章


為了更好的向您推送PacBio SMRT測序技術的最新進展,基因有限公司開辟了專門的企業微信賬號,實時解讀最新PacBio研究進展。

圖片


長按并識別二維碼并添加聯系人,您將了解到有關高準確度長讀長測序技術的最新進展,以及我們即將舉辦的線上線下活動。


      基因有限公司作為PacBio公司在中國區的獨家代理商,自2011年以來將PacBio第三代單分子實時測序技術引入國內,一直為國內用戶提供專業的三代測序系統的安裝培訓,技術支持,應用培訓與售后維護工作,贏得客戶的一致好評與信任?;蛴邢薰緦⒁蝗缂韧闹С衷絹碓蕉嗟腜acBio用戶。


歡迎關注我司“基因快訊”與“基因售后服務”官方微信

滬公網安備 31010402003540號

滬ICP備19021954號-2

国产高清成免费视频是免费视频在线播放电影网站,国产高清成免费视频在线视频免费观看!