python讀取docx文件，就是如此簡單

發布時間：2020-08-08 19:59:46 來源：ITPUB博客閱讀：247 作者：testingbang 欄目：編程語言

中文編碼問題總是讓人頭疼(尤其是mac本),想要用 Python讀取word中的內容。用open()經常報錯,通過百度搜索+問身邊小伙伴發現了 Python有專門讀取.docx的模塊python_docx。本篇文章主要來解決一個讀取docx文件的基本操作。希望感興趣的小伙伴可以堅持看下去同時歡迎提出寶貴的意見讓我們一起進步！

01：問題拋出與引入

import docx

path = "C:\\Users\\qin\\Desktop\\1.docx"

file_object=open(path,'rb')

print(file_object.read())

#輸出結果如下所示：

b'PK\\x03\\x04\\x14\\x00\\x06\\x00\\x08\\x00\\x00\\x00!\\x00J\\xbc\\x02qm\\x01\\x00\\x00

(\\x06\\x00\\x00\\x13\\x00\\x08\\x02[Content_Types].xml \\xa2\\x04\\x02(\\xa0\.....

一個很簡單的docx文件,打印出來的結果卻不是我們想要的。對此引入一個十分好用的docx模塊,下面就詳細介紹該模塊的一些基本操作。

02：安裝docx模塊

pip install python_docx

03：新建文檔對象

import docx

from docx import Document

# 新建文檔,并將其保存名為“test.docx”的文件

document = Document()

document.save('test.docx')

04：添加文檔內容

import docx

from docx import Document

from docx.shared import Inches

document = Document('C:\\Users\\qin\\Desktop\\1.docx')

document.add_heading('I like python', 0)#插入標題：0表示樣式為title標題

document.add_heading('一級標題', level=1)#插入1級標題

p = document.add_paragraph('Python是一種計算機程序設計語言 ')#插入段落

document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加圖片并指定寬度

table = document.add_table(rows=1, cols=3)  #添加一個表格，每行三列

hdr_cells = table.rows[0].cells  #獲取第一行的單元格列表對象

hdr_cells[0].text = 'ID'    #為每一個單元格賦值

hdr_cells[1].text = 'Name'

hdr_cells[2].text = 'Age'

new_cells = table.add_row().cells #為表格添加一行

new_cells[0].text = '1'

new_cells[1].text = 'Tom'

new_cells[2].text = '15'

document.add_page_break()   #添加分頁符

05：保存文檔內容

名字相同則將修改的文件內容保存; 名字不同則將修改的文件內容另存為。

import docx

from docx import Document

document.save('C:\\Users\\qin\\Desktop\\1.docx')#保存

document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存為

06：讀取文本內容

import docx

from docx import Document

path = "C:\\Users\\qin\\Desktop\\1.docx"

document = Document(path)

for paragraph in document.paragraphs:

    print(paragraph.text)

07：讀取表格內容

import docx

from docx import Document

path = "C:\\Users\\qin\\Desktop\\1.docx"

document = Document(path)  # 讀入文件

tables = document.tables   # 獲取文件中的表格集

table = tables[0]  # 獲取文件中的第一個表格

for i in range(0, len(table.rows)):  # 從表格第一行開始循環讀取表格數據

    result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}'

    # cell(i,0)表示第(i+1)行第1列數據,以此類推

    print(result)

想要知道docx模塊更多資料參考:https://python-docx.readthedocs.io/en/latest/

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

python讀取docx文件，就是如此簡單

01：問題拋出與引入

02：安裝docx模塊

03：新建文檔對象

04：添加文檔內容

05：保存文檔內容

06：讀取文本內容

07：讀取表格內容

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

python讀取docx文件，就是如此簡單

01：問題拋出與引入

02：安裝docx模塊

03：新建文檔對象

04：添加文檔內容

05：保存文檔內容

06：讀取文本內容

07：讀取表格內容

猜你喜歡

最新資訊

相關推薦

相關標簽