您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關python怎么在word中讀取表格內容的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
word文件看起來很復雜,不方便結構化。事實上,word文檔中大概有幾種內容:paragraph(段落)、table(表格)、character(字符)。我現在要分析的word文檔基本都是段落和表格。本文主要講述從word中分析表格,并將表格信息結構化的方法。
1、為了使用python解析word文件,可以使用包docx,首先需要在python中安裝它。
pip install python-docx
2、安裝后,就可以讀取word文件。
importdocx fn= r'D:\長恨歌.docx'doc=docx.Document(fn)#按段落讀取全部數據 for paragraph indoc.paragraphs:print(paragraph.text)#按表格讀取全部數據 for table indoc.tables:for row intable.rows:for cell inrow.cells:print(cell.text) table_num=len(doc.tables)#獲取文檔的表格個數 print(table_num) table_0=doc.tables[0]#選取第一個表 table_rows =len(table_0.rows)#獲取第一個表的行數 print(table_rows) tab=doc.tables[0].rows[0].cells[0]#獲取第一張表第一行第一列數據 print(tab.text) par= doc.paragraphs[2]#讀取第三段數據 print(par.text)
感謝各位的閱讀!關于“python怎么在word中讀取表格內容”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。