91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

GATK中如何計算Inbreeding coefficient

發布時間:2021-12-08 17:48:08 來源:億速云 閱讀:302 作者:柒染 欄目:大數據

GATK中如何計算Inbreeding coefficient,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

關于近交系數是什么的定義,除了英文資料,中文上也給出了很清晰的定義,這里引用一下:

近交系數(inbreeding coefficient)是指根據近親交配的世代數,將基因的純化程度用百分數來表示即為近交系數,也指個體由于近交而造成異質基因減少時,同質基因或純合子所占的百分比也叫近交系數,普遍以F或f來表示。

GATK近交系數的計算程序在github上可以找到:AS_InbreedingCoeff.java

代碼不短,但計算思路非常簡單,很容易看懂,我這里主要展示一下這個計算的核心部分,并在代碼中做些許注釋,如下:

protected double calculateIC(final VariantContext vc, final Allele altAllele) {    
   final int AN = vc.getCalledChrCount();    
   final double altAF;    
   final double hetCount = heterozygosityUtils.getHetCount(vc, altAllele);    
   
   //shortcut to get a value closer to the non-alleleSpecific value for bialleleics    
   final double F;    

   if (vc.isBiallelic()) {        
       double refAC = heterozygosityUtils.getAlleleCount(vc, vc.getReference());        
       double altAC = heterozygosityUtils.getAlleleCount(vc, altAllele);        
       double refAF = refAC/(altAC+refAC);        altAF = 1 - refAF;
       
       // inbreeding coefficient        F = 1.0 - (hetCount / (2.0 * refAF * altAF * (double) heterozygosityUtils.getSampleCount()));
           } else {        
       //compare number of hets for this allele (and any other second allele) with the expectation based on AFs        //derive the altAF from the likelihoods to account for any accumulation of fractional counts from non-primary likelihoods,        //e.g. for a GQ10 variant, the probability of the call will be ~0.9 and the second best call will be ~0.1 so adding up
       //those 0.1s for het counts can dramatically change the AF compared with integer counts        altAF = heterozygosityUtils.getAlleleCount(vc, altAllele)/ (double) AN;        
       
       // 計算inbreeding coefficient
       // heterozygosityUtils.getSampleCount() 獲取總樣本數        F = 1.0 - (hetCount / (2.0 * (1 - altAF) * altAF * (double) heterozygosityUtils.getSampleCount()));    }    
   
   return F; }

通過利用哈迪溫伯格定律來進行計算的: 1.0 - (hetCount / (2.0 (1 - altAF) altAF(double)N ,其中N是人數。這個值給出的是期望的雜合變異的個數。所以參數F(近交系數)說的就是”實際的hetCount”除以”期望的hetCount”再與1.0取差。當F值越接近0,就意味著實際的hetCount與理論的hetCount越接近。

關于GATK中如何計算Inbreeding coefficient問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

邵武市| 利川市| 洱源县| 沙洋县| 高要市| 西充县| 许昌县| 青岛市| 历史| 长顺县| 榆林市| 巴塘县| 贺州市| 兴和县| 巴青县| 衢州市| 宝坻区| 上蔡县| 峨眉山市| 上饶县| 蕉岭县| 延长县| 商南县| 原平市| 嫩江县| 建阳市| 兴仁县| 筠连县| 普格县| 阳江市| 永康市| 四子王旗| 建瓯市| 岢岚县| 盐亭县| 延川县| 兴业县| 浦东新区| 新昌县| 南岸区| 达尔|