您好,登錄后才能下訂單哦!
怎么使用ASProfile分析可變剪切事件,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
ASprofile是一款識別可變剪切事件的軟件,該軟件可以直接將同一個基因的多個轉錄本進行比較,從而鑒定可變剪切事件。該軟件安裝比較簡單,下載解壓縮即可。基本用法如下
extract-as \ transcript.gtf \ ref.fa.hdrs > as_events.txt
該腳本需要兩個參數,第一個參數為轉錄本對應的gtf
文件,在實際分析時,首先利用cufflinks
或者stringTie
從測序數據中組裝到轉錄本序列,然后將組裝的轉錄本與已知的轉錄本合并去冗余,用merge之后的非冗余轉錄本序列作為輸入;第二個參數為基因組長度統計文件,后綴為hdrs
, 內容如下
>chr1 /len=249250621 /nonNlen=225280621 /org=Homo_Sapiens(hg19) >chr2 /len=243199373 /nonNlen=238204518 /org=Homo_Sapiens(hg19) >chr3 /len=198022430 /nonNlen=194797135 /org=Homo_Sapiens(hg19)
每一行代表一條染色體,分別給出總長度,去除N堿基之后的長度以及物種信息。最后生成的文件中會給出不同可變剪切事件的詳細結果。Asprofile中的可變剪切類型定義如下
外顯子跳躍的定義如下
分別用on
和off
表示發生了外顯子跳躍前后的轉錄本,X
前綴表示外顯子的邊界非精確配對,和之前的exon相比,差了幾個bp。
單個外顯子跳躍稱之為exon skipping, 用SKIP
表示,示意如下
多個外顯子跳躍稱之為cassette exons, 用MSKIP
表示, 示意如下
內含子保留的定義如下
分別用off
和on
表示發生內含子保留前后的轉錄本,X
前綴表示外顯子的邊界非精確配對,和之前的exon相比,差了幾個bp。
單個內含子保留稱之為retention of single intron, 用IR
表示,示意如下
多個內含子保留稱之為retention of multiple introns,用MIR
表示,示意如下
外顯子替換稱之為alternative exon, 用AE
表示,示意如下
包含各種情況,比如exon的5’端不變,3’端發生變化,示意如下
exon的3’端不變,5’端發生變化,示意如下
exon的3’端和5’端同時發生變化,示意如下
轉錄起始位點的替換稱之為alternative transcript start, 用TSS
表示,示意如下
轉錄起始位點的替換稱之為alternative transcript termination, 用TTS
表示,和TSS
類似,只不過是3’末端位置發生了改變,示意如下
上述文件中可變剪切事件是以轉錄本為單位進行展示的,每行代表一個轉錄本,存在冗余,當我們想要知道某個基因上發生的可變剪切的類型和數量時,該文件就不夠直觀,官方提供了summarize_as.pl
腳本,可以方便的得到非冗余的可變剪切事件以及每個基因可變剪切事件的匯總信息,用法如下
perl summarize_as.pl \ transcript.gtf \ as.events.txt \ -p prefix
該腳本會生成兩個文件,后綴為nr
的文件中,是非冗余的可變剪切事件;后綴為summary
的文件中是每個基因可變剪切的類型統計,示意如下
通過Asprofile
, 可以直接對同一個基因的多個轉錄本進行比較,從而鑒別不同的可變剪切事件,除此之外,Asprofile
還提供了定量的功能, 可以計算fpkm
值,通過collect_fpkm.pl
腳本可以匯總多個樣本的可變剪切結果,用法如下
perl collect_fpkm.pl sampleA.AS,sampleB.AS -s txt
多個樣本用逗號連接,-s
指定對應文件的后綴,通過樣本名字加后綴識別對應的文件。該腳本會給出每個可變剪切事件在樣本中的比例,基于這個比例我們可以進行差異分析。更多用法請參考官方說明和腳本的幫助文檔。
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。