您好,登錄后才能下訂單哦!
小編給大家分享一下motif中PFM矩陣是怎么樣的,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
PFM全稱為position frequency matrix, 用于代表motif的堿基分布頻數,本身是一個很容易了解的概念,以下圖所示的motif序列為例
根據以上8條序列可以統計出對應的堿基分布頻數,如下所示
每行為一種堿基,每一列為motif的一個位置。
在描述motif信息時,除了一致性序列和sequence logo外,PFM矩陣也是一個常見的元素。不同軟件會有不同的標準,理解這些格式就是本文的核心內容。
JASPAR是一個常用的轉錄因子motif數據庫,在該數據庫中,針對PFM矩陣有多種格式,如下圖所示
原始的PFM矩陣示意如下
第一行和fasta格式的序列標識符類似,>
開頭,MA
開頭的字符串為轉錄因子在JASPAR數據庫中的編號,是唯一的,AGL3
表示該轉錄因子的名稱。
接下來的4行依次表示A
, C
, G
, T
4種堿基在每個位置的頻數分布。
JASPAR格式的PFM矩陣示意如下
和原始的PFM矩陣非常類似,只不過在每行的開頭標注了對應的堿基,并且用[
和]
操作符將堿基頻數矩陣括起來。
TRANSFAC格式的PFM矩陣示意如下
采用了TRANSFAC數據庫中的文件標準,AC
表示motif編號,ID
表示motif的名稱,PO
以及下面的行為對應的堿基分布頻數。
MEME格式的PFM矩陣示意如下
ALPJABEAT
代表堿基的字符集,strands
代表鏈的方向性,+ -
代筆在使用meme預測motif時沒有指定鏈的方向,Background
代表背景中的堿基組成頻率,MOTIF
和以下的行為對應的堿基分布頻率。
不同的軟件和數據庫對應的PFM矩陣的格式不同,在使用不同軟件和數據庫時需要注意。
看完了這篇文章,相信你對“motif中PFM矩陣是怎么樣的”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。