91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python讀取word文本操作詳解

發布時間:2020-08-28 04:27:34 來源:腳本之家 閱讀:445 作者:熊貓大哥大 欄目:開發技術

本文研究的主要問題時Python讀取word文本操作,分享了相關概念和實現代碼,具體如下。

一,docx模塊

Python可以利用python-docx模塊處理word文檔,處理方式是面向對象的。也就是說python-docx模塊會把word文檔,文檔中的段落、文本、字體等都看做對象,對對象進行處理就是對word文檔的內容處理。

二,相關概念

如果需要讀取word文檔中的文字(一般來說,程序也只需要認識word文檔中的文字信息),需要先了解python-docx模塊的幾個概念。

1,Document對象,表示一個word文檔。
2,Paragraph對象,表示word文檔中的一個段落
3,Paragraph對象的text屬性,表示段落中的文本內容。

三,模塊的安裝和導入

需要注意,python-docx模塊安裝需要在cmd命令行中輸入pip install python-docx,如下圖表示安裝成功(最后那句英文Successfully installed,成功地安裝完成,十分考驗英文水平。)

Python讀取word文本操作詳解

注意在導入模塊時,用的是import docx。

也真是奇了怪了,怎么安裝和導入模塊時,很多都不用一個名字,看來是很有必要出一個python版本的模塊管理程序python-maven了,本段純屬PS。

四,讀取word文本

在了解了上面的信息之后,就很簡單了,下面先創建一個D:\temp\word.docx文件,并在其中輸入如下內容。

Python讀取word文本操作詳解

然后寫一段程序,代碼及輸出結果如下:

#讀取docx中的文本代碼示例
import docx
#獲取文檔對象
file=docx.Document("D:\\temp\\word.docx")
print("段落數:"+str(len(file.paragraphs)))#段落數為13,每個回車隔離一段

#輸出每一段的內容
for para in file.paragraphs:
 print(para.text)

#輸出段落編號及段落內容
for i in range(len(file.paragraphs)):
 print("第"+str(i)+"段的內容是:"+file.paragraphs[i].text)

運行結果:

================ RESTART: F:/360data/重要數據/桌面/學習筆記/readWord.py ================
段落數:13
啊

我看見一座山

雄偉的大山

真高啊

啊

這座山是!

真的很高!
第0段的內容是:啊
第1段的內容是:
第2段的內容是:我看見一座山
第3段的內容是:
第4段的內容是:雄偉的大山
第5段的內容是:
第6段的內容是:真高啊
第7段的內容是:
第8段的內容是:啊
第9段的內容是:
第10段的內容是:這座山是!
第11段的內容是:
第12段的內容是:真的很高!
>>> 

總結

以上就是本文關于Python讀取word文本操作詳解的全部內容,希望對大家有所幫助。感興趣的朋友可以繼續參閱本站其他相關專題,如有不足之處,歡迎留言指出。感謝朋友們對本站的支持!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

凤阳县| 册亨县| 班戈县| 宁波市| 新巴尔虎右旗| 谢通门县| 开江县| 马尔康县| 南漳县| 灵璧县| 嘉黎县| 景德镇市| 托克逊县| 奉贤区| 泾源县| 巢湖市| 屏山县| 新巴尔虎左旗| 伊宁县| 兰溪市| 汝阳县| 旬阳县| 和平区| 鄂伦春自治旗| 工布江达县| 伽师县| 武强县| 锡林郭勒盟| 绩溪县| 保德县| 大方县| 新密市| 怀柔区| 河池市| 虎林市| 托里县| 平昌县| 龙江县| 贵阳市| 涿州市| 天峨县|