您好,登錄后才能下訂單哦!
本篇內容主要講解“如何用R語言XML包獲得html文件中的表格”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“如何用R語言XML包獲得html文件中的表格”吧!
使用snpEff
軟件對vcf
格式文件進行注釋后會生成一個snpEff_summary.html
;這個文件是對vcf
格式文件中的內容進行的統計,結果會以表格和圖片的形式在html文件里展示。我現在想把html中的數據提取出來,自己來做圖。
https://stackoverflow.com/questions/14517732/how-to-get-table-data-from-html-table-in-xml
How to get table data from html table in xml
使用到的R語言代碼
library(XML)
doc<-htmlParse("snpEff_summary.html")
total_table<-getNodeSet(doc,"//table")
# 以上代碼是固定的寫法
# 下面的代碼想獲得第幾個表格,中括號中的數字就改成幾
df3<-readHTMLTable(total_table[[3]])
df3
class(df3)
結果以數據框的形式存儲
vcftools --vcf input.vcf --min-alleles 2 --max-alleles 2 --recode --recode-INFO-all --out output_vcf_prefix
vcftools的幫助文檔
--min-alleles <integer>
--max-alleles <integer>
Include only sites with a number of alleles greater than or equal to the "--min-alleles" value and less than or equal to the "--max-alleles" value. One of these options may be used without the other.
For example, to include only bi-allelic sites, one could use:
vcftools --vcf file1.vcf --min-alleles 2 --max-alleles 2
到此,相信大家對“如何用R語言XML包獲得html文件中的表格”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。