您好,登錄后才能下訂單哦!
這篇文章主要介紹“自動化運行OrthoMCL的方法”,在日常操作中,相信很多人在自動化運行OrthoMCL的方法問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”自動化運行OrthoMCL的方法”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
安裝OrthoMCL Pipeline
直接去github下載zip安裝包,或者直接使用git命令下載
git clone https://github.com/apetkau/orthomcl-pipeline.git
安裝perl依賴包
使用cpan或者cpanm安裝依賴包
$ cpanm BioPerl DBD::mysql DBI Parallel::ForkManager YAML::Tiny Set::Scalar Text::Table Exception::Class Test::Most Test::Warn Test::Exception Test::Deep Moose SVG Algorithm::Combinatorics
安裝blast,MCL及OrthoMCL
安裝好2.2.26版本的BLAST (blastall, formatdb, 不是blast+, 更舊的版本可能不會正確運行)
下載編譯安裝MCL
下載編譯安裝OrthoMCL
確保blastall, formatdb, MCl和OrthoMCL都加入了環境變量
檢查依賴的軟件是否安裝齊全
出現下面的提示則安裝齊全了
$ perl scripts/orthomcl-pipeline-setup.pl
Checking for Software dependencies...
Checking for OthoMCL ... OK
Checking for formatdb ... OK
Checking for blastall ... OK
Checking for mcl ... OK
Wrote new configuration to orthomcl-pipeline/scripts/../etc/orthomcl-pipeline.conf
Wrote executable file to orthomcl-pipeline/scripts/../bin/orthomcl-pipeline
Please add directory orthomcl-pipeline/scripts/../bin to PATH
Orthomcl-pipeline配置文件
配置文件在orthomcl-pipeline-installed-path/etc/orthomcl-pipeline.conf
blast: F: 'm S' b: 100000 e: 1e-5 v: 100000 filter: max_percent_stop: 20 min_length: 10 mcl: inflation: 1.5 path: blastall: '/usr/bin/blastall' formatdb: '/usr/bin/formatdb' mcl: '/usr/local/bin/mcl' orthomcl: '/home/aaron/software/orthomcl/bin' scheduler: fork split: 4
根據計算資源可以把split改為合適的數字,split類似于運行的線程數
配置數據庫
需要安裝好MySQL數據庫
1. 如果之前已經創建過orthomcl數據庫,可以用下面的perl腳本進行配置
$ perl scripts/orthomcl-setup-database.pl --user orthomcl --password orthomcl --host localhost --database orthomcl --outfile orthomcl.conf --no-create-database Connecting to database orthmcl on host orthodb with user orthomcl ...OK Config file **orthomcl.conf** created.
2. 如果之前沒有配置過orthomcl數據庫,需要先以root運行mysql,創建orthomcl用戶
$ mysql -u root -p Enter password: mysql> GRANT SELECT, INSERT, UPDATE, DELETE, CREATE, CREATE VIEW, INDEX, DROP on *.* to orthomcl; #創建用戶并授權 mysql> set password for orthomcl@localhost = password('orthomcl'); #設置用戶密碼 mysql> quit;
當用戶創建后,再用perl腳本配置
$ perl scripts/orthomcl-setup-database.pl --user orthomcl --password orthomcl --host localhost --database orthomcl --outfile orthomcl.conf Connecting to mysql and creating database **orthmcldb** on host orthodb with user orthomcl ...OK database orthmcl created ...OK Config file **orthomcl.conf** created.
腳本會生成orthomcl.conf文件,這個文件之后就不用坐任何修改了。
測試
$ perl t/test_pipeline.pl -m orthomcl.conf -s fork -t /tmp Test using scheduler fork TESTING NON-COMPLIANT INPUT TESTING FULL PIPELINE RUN 3 README: Tests case of one gene (in 1.fasta and 2.fasta) not present in other files. ok 1 - Expected matched returned groups file ...
出現上面的信息說明安裝成功了!!!
運行
$ ./bin/orthomcl-pipeline Error: no input-dir definedUsage: orthomcl-pipeline -i [input dir] -o [output dir] -m [orthmcl config] [Options] ...
可以加上—nocompliant就可以不顯示沒必要的提示信息了
$ ./bin/orthomcl-pipeline -i ~/test_data/zbl -o ~/test_data/zbl-out -m orthomcl.conf --nocompliant
zbl文件夾里面放入fasta格式的蛋白序列文件,一個基因組一個文件,例如genome1.fasta, genome2.fasta, 文件后綴名必需是.fasta。zbl-out文件夾里面是所有的結果,包括聚類完成的groups文件,orthologs文件,inparalogs文件以及coorthologs文件。
到此,關于“自動化運行OrthoMCL的方法”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。