91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

利用de Bruijn graph組裝基因組時Kmer為什么必須是奇數

發布時間:2021-12-20 09:35:55 來源:億速云 閱讀:238 作者:柒染 欄目:大數據

這期內容當中小編將會給大家帶來有關利用de Bruijn graph組裝基因組時Kmer為什么必須是奇數,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

根本原因就是為了避免導致正反鏈混淆

如果kmer是偶數,我們會發現基因組上有些序列(如,CGCGCGCG,kmer=4)的Kmer在反向互補后得到的序列仍然是它自身!這是不能允許發生的。因為這將導致你無法區分某段序列的kmer到底是屬于它自身還是說只是來自于它的互補鏈!!這會給解de Bruijn graph帶來極大的混淆和困難!

或許你會覺得 “為什么我需要糾結于序列是不是來自互補鏈呢?畢竟雙鏈DNA的正反鏈是嚴格反向互補的啊,基因組組裝技術不也是把它們合并裝在一起的嗎?!”。你若是這樣來理解其實是非常難得的,但前提卻是基因組必須能夠被一次性完整地(至少是非常接近完整)測出來,這時的測序深度甚至只需是1就可以了。但是你回頭想想,既然都已經把基因組完整測序出來了,那還要組裝干嘛呢?

利用de Bruijn graph組裝基因組時Kmer為什么必須是奇數

并且,目前的NGS測序技術也做不到通測基因組。一般來說都是測出上百萬千萬億萬個小小的片段(read,長度一般是100bp-300bp)。而且,為了確保準確性,基因組都會被反復測很多層。組裝時構建的kmer單位,實際上是對這些read進行的。具體的操作就是按照kmer的長度把這些read切割成更小的、存在重疊關系的片段。那么,此刻當我們構建de Bruijn graph時,如何能夠保證正確地把同屬于一條read上的Kmer連接起來,就顯得極為重要了!我們不能一會兒把A kmer正確地連到它自己所在的read,一會兒又連到它互補鏈的read上去!

這就是為何Kmer不能是偶數的原因了,因為只有奇數,才能保證每個kmer序列的反向互補kmer與自身也是不同的,而這個不同的真正意義就是為了避免正反鏈混淆。比如 :5-mer的 CGCGC,反向互補后是 GCGCG, 它們是不同的;這就不會像 4-mer,CGCG發現它反向互補后仍然是CGCG,這個時候就就會在后續連接kmer的過程中發生正負鏈混淆,裝出一個嵌合體基因組!

最后,放一張發表在Genome Research有關組裝的圖,大家可以大致感受一下這一段重復序列的組裝過程。

利用de Bruijn graph組裝基因組時Kmer為什么必須是奇數


在我不斷回答公眾號后臺一個一個的問題之后,我強烈意識到需要有一個地方,來把和朋友們共同討論的有價值內容匯集起來。于是我在知識星球上開通了一個圈子,名字是:解螺旋技術交流圈,這是與讀者們的私人朋友圈,它是付費的,它也是知識星球上第一個真正與基因組學和生物信息學強相關的圈子。

上述就是小編為大家分享的利用de Bruijn graph組裝基因組時Kmer為什么必須是奇數了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

德格县| 梧州市| 崇礼县| 连江县| 桂东县| 樟树市| 札达县| 漳浦县| 鹤庆县| 乡宁县| 柘城县| 金秀| 宁海县| 扎囊县| 平遥县| 望城县| 普定县| 绥江县| 玉树县| 黄龙县| 平罗县| 六枝特区| 名山县| 四会市| 仁化县| 西峡县| 达拉特旗| 黎城县| 延川县| 修武县| 西平县| 鄂尔多斯市| 平远县| 商河县| 历史| 惠东县| 阿拉善右旗| 浑源县| 阳朔县| 井陉县| 平邑县|