91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python中pdfplumber如何提取pdf中的表格數據

發布時間:2020-10-29 09:19:00 來源:億速云 閱讀:934 作者:小新 欄目:編程語言

小編給大家分享一下Python中pdfplumber如何提取pdf中的表格數據,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去學習方法吧!

作為一個強大的pdf文件解析工具,pdfplumber庫可迅速將pdf文檔轉換為易于處理的txt文檔,并輸出pdf文檔的字符、頁面、頁碼等信息,還可進行頁面可視化操作。使用pdfplumber庫前需先安裝,即在cmd命令行中輸入:

pip install pdfplumber

pdfplumber庫提供了兩種pdf表格提取函數,分別為.extract_tables( ).extract_table( ),兩種函數提取結果存在差異。為進行演示,我們網站上下載了一份短期融資券主體信用評級報告,為pdf格式。任意選取某一表格,其界面如下:

Python中pdfplumber如何提取pdf中的表格數據


(1).extract_tables( )


可輸出頁面中所有表格,并返回一個嵌套列表,其結構層次為table→row→cell。此時,頁面上的整個表格被放入一個大列表中,原表格中的各行組成該大列表中的各個子列表。若需輸出單個外層列表元素,得到的便是由原表格同一行元素構成的列表。例如,我們執行如下程序:

import pdfplumber 
with pdfplumber.open(r'F:python財務報表主體評級報告.pdf')  as pdf:
   page = pdf.pages[45]    #設置操作頁面 
   for row inpage.extract_tables() :
          print(row)
          print(row[0])   #打印外層列表第一個元素


輸出結果:


Python中pdfplumber如何提取pdf中的表格數據


(2).extract_table( )


返回多個獨立列表,其結構層次為row→cell。若頁面中存在多個行數相同的表格,則默認輸出頂部表格;否則,僅輸出行數最多的一個表格。此時,表格的每一行都作為一個單獨的列表,列表中每個元素即為原表格的各個單元格內容。若需輸出某個元素,得到的便是具體的數值或字符串。如下:

with pdfplumber.open(r'F:python財務報表主體評級報告.pdf') as pdf:
     page = pdf.pages[45]
     for row in page.extract_table() : 
         print(row) 
         print(row[0])      #打印每個列表對應的第一個元素


輸出結果:


Python中pdfplumber如何提取pdf中的表格數據


感謝你能夠認真閱讀完這篇文章,希望小編分享Python中pdfplumber如何提取pdf中的表格數據內容對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,遇到問題就找億速云,詳細的解決方法等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

罗平县| 临汾市| 喜德县| 民乐县| 独山县| 兴安盟| 中卫市| 西华县| 榆社县| 赣州市| 江华| 长海县| 凤冈县| 阳高县| 资兴市| 吉木萨尔县| 汪清县| 连平县| 宜州市| 城固县| 陇南市| 勐海县| 中江县| 六盘水市| 大理市| 阿拉尔市| 富蕴县| 茂名市| 怀宁县| 汾阳市| 神池县| 南丹县| 娱乐| 中山市| 玛多县| 田林县| 农安县| 青铜峡市| 突泉县| 洛宁县| 镇巴县|