91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么使用EXCAVATOR2檢測WES的CNV

發布時間:2021-11-10 10:09:09 來源:億速云 閱讀:179 作者:柒染 欄目:大數據

怎么使用EXCAVATOR2檢測WES的CNV,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

excavator2是一款利用WES數據進行CNV分析的軟件,其他同類軟件通常只關注捕獲的exon區域,而該軟件則進行了延伸,將捕獲區域劃分為exon和非exon區域兩部分,在校正測序深度的分布時對這兩部分區域分別分別進行處理,對應的文章發表在Nucleic Acids Research上,鏈接如下

https://academic.oup.com/nar/article/44/20/e154/2607979

該軟件的源代碼保存在sourceforge上,鏈接如下

https://sourceforge.net/projects/excavator2tool/

excavator2在計算測序深度時將reads分為了以下兩個部分

  1. in-target reads

  2. off-target reads


in-target表示的是位于exon上的序列,off-target表示的是位于基因間區或者內含子區的序列,同樣采用了滑動窗口的方式來統計每個區域的測序深度,只不過稍作變化,全稱如下

mean windows read count

簡稱WMRC, 計算公式如下

怎么使用EXCAVATOR2檢測WES的CNV

單個外顯子直接作為一個窗口,而非外顯子區域則采用了一個固定長度的窗口,分開統計不同區域的測序深度,并進行校正,校正的時候考慮了GC含量,不同區域的mappability, 外顯子的大小等因素。

利用歸一化之后的測序深度,計算對照樣本和實驗樣本的log2 ratio值,然后采用HSLM segmentation算法劃分segment, 最后通過FastCall算法預測每個segment的拷貝數情況,細分為以下5種

  1. two-copy deletion

  2. one-copy deletion

  3. normal

  4. one-copy duplication

  5. multiple-copy duplicaiton


該軟件支持hg19和hg38兩個版本,內置了對應的數據庫,示意如下

怎么使用EXCAVATOR2檢測WES的CNV

該軟件分成了3個模塊,對應3個腳本,具體操作步驟如下

1. TargetPerla.pl

提供一個捕獲區域的bed文件,計算in-target和off-target區域的GC含量,mappability值,用于后續的歸一化操作,用法如下

perl TargetPerla.pl \
SourceTarget.txt \
myTarget.bed \
MyTarget_w50000 \
50000 \
hg19

第一個參數為source target文件,該文件記錄了基因組對應的bw文件和fasta文件的路徑,內容示意如下

/data/ucsc.hg19.bw /data/hg19.fasta

空格分隔的兩列,第一列為bw文件的路徑,該文件是軟件自帶的,位于軟件的安裝目錄,用于計算基因組不同區域的mappability,第二列為fasta文件的路徑,用于計算不同區域的GC含量。

第二個參數為捕獲區域的bed文件,第三個參數為輸出結果的前綴,第四個參數為窗口的固定長度,第五個參數指定基因組的版本。

這一步類似于比對時建立參考基因組的索引,一個芯片建立一次即可,運行成功后,會生成一個文件夾,前綴為MyTarget_w50000。

2. EXCAVATORDataPrepare.pl

計算測序深度,進行歸一化處理,用法如下

perl EXCAVATORDataPrepare.pl \
ExperimentalFile.txt \
--processors 6 \
--target MyTarget_w50000 \
--assembly hg19

第一個參數是一個空格分隔的txt文件,指定了樣本對應的bam文件,輸出結果的路徑,樣本名稱信息,內容示意如下

怎么使用EXCAVATOR2檢測WES的CNV

--processors指定并行的線程數,--target參數指定第一步生成的target的名稱,--assembly指定參考基因組的版本。

3. EXCAVATORDataAnalysis.pl

執行HSLM segmentation算法和FastCall算法,進行CNV分析,用法如下

perl EXCAVATORDataAnalysis.pl \
ExperimentalFileAnalysis.txt \
--processors 6  \
--target MyTarget_w50000 \
--assembly hg19 \
--output Results_MyProject_w50K \
--mode pooling

--mode參數表示樣本如何進行比較,支持pooling和paired兩種模式,第一種模式將所有的實驗樣本混合與對照樣本進行比較,第二種模式則是配對樣本模式,比如癌和癌旁,兩兩之間進行比較,計算log2 ration值。

第一個參數ExperimentalFileAnalysis.txt是一個空格分隔的txt文件,指定了樣本的比較操作,對于pooling模式,其內容示意如下

怎么使用EXCAVATOR2檢測WES的CNV

對于paired模式,其內容示意如下

怎么使用EXCAVATOR2檢測WES的CNV

T表示Treat, C表示Control, 后面的數字用于區分不同樣本。

--output指定了輸出結果的目錄,輸出結果中提供了CNV區域對應的txt, VCF等文件,同時還提供了可視化的結果,示意如下

怎么使用EXCAVATOR2檢測WES的CNV


關于怎么使用EXCAVATOR2檢測WES的CNV問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

固镇县| 赣榆县| 青阳县| 丁青县| 江西省| 临武县| 栾城县| 方山县| 赣榆县| 南城县| 泰顺县| 鄂托克前旗| 密山市| 斗六市| 陇西县| 开阳县| 海门市| 林周县| 建昌县| 南澳县| 深圳市| 项城市| 宜宾县| 聂拉木县| 西青区| 大丰市| 博兴县| 凭祥市| 仙桃市| 蒙城县| 威宁| 永靖县| 南漳县| 闵行区| 壶关县| 洱源县| 浏阳市| 温泉县| 大丰市| 永昌县| 安康市|