pdf用python讀取的方法

發布時間：2020-07-02 14:21:36 來源：億速云閱讀：201 作者：清晨欄目：編程語言

這篇文章主要介紹pdf用python讀取的方法，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們一定要看完！

python中可以使用pdfminer庫來讀取PDF文件中的內容。

安裝命令：

pip install pdfminer

pip install pdfminer3k

python中讀取PDF文件代碼：

from urllib.request import urlopen
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter import TextConverter
from pdfminer.layout import LAParams
from io import StringIO
from io import open

def readPDF(pdfFile):
    rsrcmgr = PDFResourceManager()
    retstr = StringIO()
    laparams = LAParams()
    device = TextConverter(rsrcmgr, retstr, laparams=laparams)

    process_pdf(rsrcmgr, device, pdfFile)
    device.close()

    content = retstr.getvalue()
    retstr.close()
    return content

pdfFile = urlopen("http://pythonscraping.com/pages/warandpeace/chapter1.pdf")
outputString = readPDF(pdfFile)
print(outputString)
pdfFile.close()

解析pdf文件用到的類：

PDFParser：從一個文件中獲取數據
PDFDocument：保存獲取的數據，和PDFParser是相互關聯的
PDFPageInterpreter處理頁面內容
PDFDevice將其翻譯成你需要的格式
PDFResourceManager用于存儲共享資源，如字體或圖像。

以上是pdf用python讀取的方法的所有內容，感謝各位的閱讀！希望分享的內容對大家有幫助，更多相關知識，歡迎關注億速云行業資訊頻道！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

pdf用python讀取的方法

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

pdf用python讀取的方法

猜你喜歡

最新資訊

相關推薦

相關標簽