91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

bcftools csq怎樣分析基因突變對蛋白水平的影響

發布時間:2021-12-16 16:55:17 來源:億速云 閱讀:231 作者:柒染 欄目:大數據

bcftools csq怎樣分析基因突變對蛋白水平的影響,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

csq命令可以分析SNP位點在基因組上的位置,同時還會預測基因突變對編碼蛋白的影響。

和其他預測基因突變對蛋白質影響的軟件不同,bcftools 將基因組劃分為不同的獨立區域(和單倍型區域概念類似),在分析蛋白質變化時,會綜合考慮該區域內的所有突變位點,示意圖如下

bcftools csq怎樣分析基因突變對蛋白水平的影響

A圖中,該區域包含兩個SNP位點,如果單獨考慮每個位點,只能預測到氨基酸替換,由精氨酸替換為色氨酸或者谷氨酰胺, 綜合考慮兩個SNP位點時,對應的DNA序列變成了一個終止密碼子,蛋白質長度都發生了變化。

B圖中,該區域包含了2個indel 位點,單獨考慮每個indel位點時,都是發生了移碼突變,氨基酸長度發生了變化,綜合考慮兩個SNP位點時,氨基酸變化和單獨分析一個位點時,又大不一樣。

C圖中,兩個SNP位點發生在剪切位點兩側,單獨考慮每個SNP位點,氨基酸由天冬氨酸替換為天冬酰胺或者谷氨酸,綜合考慮兩個突變位點時,氨基酸由天冬酰胺替換成賴氨酸。

從示意圖可以發現,單獨考慮每個SNP位點對于蛋白質的影響,其結果是有偏差的,只有綜合考慮鄰近范圍內所有的突變位點,預測到的蛋白質變化結果才更加可靠。

csq 運行命令如下

bcftools csq -f csq.fa -g csq.gff3 csq.vcf > csq.out

-f參數指定參考基因組的fasta文件,-g參數指定參考基因組的gff3文件,csq.vcf為輸入的VCF文件,csq.out為輸出文件。

輸出文件的格式也是VCF格式,會在INFO列中新增一個BCSQ字段,用來描述突變位點在基因組上的位置和蛋白質序列的變化,示例如下

BCSQ=synonymous|XYZ|ENST00000000001|protein_coding|+|1Y|102C>T

BCSQ的信息由多個字段構成,中間用|連接,包含以下字段

  1. consequence type
    基因突變對蛋白影響的類型,包括synonymous, missense, inframe_deletion等類型

  2. gene
    基因名稱

  3. transcript
    轉錄本名稱

  4. biotype
    基因類型

  5. strand
    正負鏈信息

  6. amino  acid positon
    氨基酸的位置

  7. variants list
    預測氨基酸變化時,考慮的突變位點的集合


由于bcftools是綜合考慮多個突變位點對蛋白質的共同作用,在實際分析時,應該盡可能的過濾掉假陽性的突變位點,然后再分析蛋白水平的影響,這樣的分析結果,可信度會更高。

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

青龙| 万盛区| 铜川市| 安远县| 湛江市| 广水市| 吉隆县| 双柏县| 宣恩县| 芜湖县| 塔城市| 濮阳市| 伊宁市| 天峨县| 多伦县| 浠水县| 台中市| 巴林右旗| 惠东县| 青铜峡市| 高邑县| 霍州市| 星子县| 平邑县| 安阳市| 曲阜市| 江达县| 绥芬河市| 获嘉县| 无为县| 宁德市| 那曲县| 保靖县| 泸州市| 色达县| 盐池县| 沾化县| 天门市| 涞水县| 名山县| 石首市|