91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python讀取docx文件,就是如此簡單

發布時間:2020-08-08 19:59:46 來源:ITPUB博客 閱讀:247 作者:testingbang 欄目:編程語言

中文編碼問題總是讓人頭疼(尤其是mac本),想要用 Python讀取word中的內容。用open()經常報錯,通過百度搜索+問身邊小伙伴發現了 Python有專門讀取.docx的模塊python_docx。本篇文章主要來解決一個讀取docx文件的基本操作。希望感興趣的小伙伴可以堅持看下去同時歡迎提出寶貴的意見讓我們一起進步!

01:問題拋出與引入
import docx

path = "C:\\Users\\qin\\Desktop\\1.docx"
file_object=open(path,'rb')
print(file_object.read())
#輸出結果如下所示:
b'PK\\x03\\x04\\x14\\x00\\x06\\x00\\x08\\x00\\x00\\x00!\\x00J\\xbc\\x02qm\\x01\\x00\\x00
(\\x06\\x00\\x00\\x13\\x00\\x08\\x02[Content_Types].xml \\xa2\\x04\\x02(\\xa0\.....

一個很簡單的docx文件,打印出來的結果卻不是我們想要的。對此引入一個十分好用的docx模塊,下面就詳細介紹該模塊的一些基本操作。

02:安裝docx模塊
pip install python_docx

03:新建文檔對象
import docx

from docx import Document
# 新建文檔,并將其保存名為“test.docx”的文件
document = Document()
document.save('test.docx')
04:添加文檔內容
import docx

from docx import Document
from docx.shared import Inches
document = Document('C:\\Users\\qin\\Desktop\\1.docx')
document.add_heading('I like python', 0)#插入標題:0表示樣式為title標題
document.add_heading('一級標題', level=1)#插入1級標題
p = document.add_paragraph('Python是一種計算機程序設計語言 ')#插入段落
document.add_picture('C:\\Users\\qin\\Desktop\\1.png', width=Inches(1.25)) #添加圖片并指定寬度
table = document.add_table(rows=1, cols=3)  #添加一個表格,每行三列
hdr_cells = table.rows[0].cells  #獲取第一行的單元格列表對象
hdr_cells[0].text = 'ID'    #為每一個單元格賦值
hdr_cells[1].text = 'Name'
hdr_cells[2].text = 'Age'
new_cells = table.add_row().cells #為表格添加一行
new_cells[0].text = '1'
new_cells[1].text = 'Tom'
new_cells[2].text = '15'
document.add_page_break()   #添加分頁符
05:保存文檔內容

名字相同則將修改的文件內容 保存; 名字不同則將修改的文件內容 另存為

import docx

from docx import Document
document.save('C:\\Users\\qin\\Desktop\\1.docx')#保存
document.save('C:\\Users\\qin\\Desktop\\2.docx')#另存為
06:讀取文本內容
import docx

from docx import Document
path = "C:\\Users\\qin\\Desktop\\1.docx"
document = Document(path)
for paragraph in document.paragraphs:
   print(paragraph.text)
07:讀取表格內容
import docx

from docx import Document
path = "C:\\Users\\qin\\Desktop\\1.docx"
document = Document(path)  # 讀入文件
tables = document.tables   # 獲取文件中的表格集
table = tables[0]  # 獲取文件中的第一個表格
for i in range(0, len(table.rows)):  # 從表格第一行開始循環讀取表格數據
   result = f'{(table.cell(i, 0).text):<5}' + "" + f'{(table.cell(i, 1).text):<5}' + "" + f'{(table.cell(i, 2).text):<5}'
   # cell(i,0)表示第(i+1)行第1列數據,以此類推
   print(result)

想要知道docx模塊更多資料參考:https://python-docx.readthedocs.io/en/latest/

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

呼图壁县| 成都市| 庆城县| 甘南县| 凤翔县| 广元市| 寻乌县| 上栗县| 桐城市| 张家口市| 东丽区| 宝鸡市| 潜山县| 社会| 峡江县| 鄯善县| 林西县| 恭城| 玉环县| 元谋县| 景洪市| 迁西县| 舞钢市| 和平县| 乐都县| 绥中县| 西乌珠穆沁旗| 延长县| 舟曲县| 芦山县| 儋州市| 海南省| 九江县| 慈溪市| 梅河口市| 海宁市| 金塔县| 饶平县| 化德县| 南华县| 东宁县|