您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“HiC-Pro怎么用”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“HiC-Pro怎么用”這篇文章吧。
HiC-Pro軟件非常靈活,不僅可以處理各種不同建庫方式的Hi-C數據,也可以處理capture Hi-C數據。軟件安裝過程如下
yum install -y epel-release
# R
yum install -y R
R
install.packages(c("ggplot2", "RColorBrewer"))
# python
yum install -y gcc gcc-c++ make
yum install -y python2 python-devel python2-pip
pip install pysam
pip install "scipy<1"
pip install bx-python
# bowtie2
yum install -y wget
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.1/bowtie2-2.3.4.1-linux-x86_64.zip
unzip bowtie2-2.3.4.1-linux-x86_64.zip
# samtools
yum install bzip2 bzip2-devel libcurl libcurl-devel ncurses-devel openssl openssl-devel
wget https://github.com/samtools/samtools/releases/download/1.6/samtools-1.6.tar.bz2
tar xjvf samtools-1.6.tar.bz2
cd samtools-1.6/
./configure
make
make install
# HiC-Pro
wget https://github.com/nservant/HiC-Pro/archive/v2.11.1.tar.gz
tar xzvf v2.11.1.tar.gz
cd HiC-Pro-2.11.1
make configure
make install
安裝好之后,需要準備以下幾種參考物種的相關文件
通過軟件自帶的腳本可以產生基因組對應的酶切圖譜,輸入內切酶的名稱或者酶切位點序列都可以,用法如下
digest_genome.py -r A^AGCTT -o mm9_hindiii.bed mm9.fasta
digest_genome.py -r hindiii -o mm9_hindiii.bed mm9.fasta
軟件采用bowtie2
將reads比對到參考基因組上,所以需要對基因組的fasta文件建立索引,用法如下
bowtie2-build hg19.fasta hg19
從UCSC下載染色體長度文件,或者自己根據fasta序列統計長度都可以,該文件內容如下
chr1 249250621
chr2 243199373
chr3 198022430
chr4 191154276
這里我們用官網提供的測試數據展示下基本用法,首先下載測試數據
wget --no-check-certificate https://zerkalo.curie.fr/partage/HiC-Pro/HiCPro_testdata.tar.gz
tar xzcf HiCPro_testdata.tar.gz
HiC-Pro的所有參數都記錄在配置文件中,安裝目錄提供了配置文件的模板config_test_latest.txt`, 在此基礎上進行編輯就可以了。常見的需要配置的參數如下
BOWTIE2_IDX_PATH = /data/annotation/Human/hg19/base
REFERENCE_GENOME = hg19
GENOME_SIZE = chrom_hg19.sizes
GENOME_FRAGMENT = HindIII_resfrag_hg19.bed
LIGATION_SITE = AAGCTAGCTT
對于這個測試文件,只需要編輯bowtie2索引所在目錄就可以了,編輯好之后直接運行,用法如下
HiC-Pro -i test_data/ -o out_dir -c config_test_latest.txt
用法非常簡單,-i
參數指定樣本fastq文件文件所在目錄,-o
參數指定輸出結果的目錄,-c
參數指定配置文件的名稱。
對于fastq文件所在目錄,結構如下所示
├── dixon_2M
│ ├── SRR400264_00_R1.fastq.gz
│ └── SRR400264_00_R2.fastq.gz
└── dixon_2M_2
├── SRR400264_01_R1.fastq.gz
└── SRR400264_01_R2.fastq.gz
每個樣本一個子文件夾,下面是對應的雙端測序的fastq文件。輸出結果目錄如下
|-- bowtie_results
|-- config_test_latest.txt
|-- hic_results
|-- logs
|-- rawdata -> /HiC-Pro-2.11.1/test_data/
`-- tmp
其中hic_results
目錄下是最終結果,包含了不同分辨率下的hi-c圖譜和質控的圖表。
以上是“HiC-Pro怎么用”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。