您好,登錄后才能下訂單哦!
本篇文章給大家分享的是有關怎么在Python中利用OCR對PDF圖片進行識別,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
使用圖片識別可以快速提取圖片中的信息,方便高效。
Python并不能直接對PDF進行識別,所以如果是識別PDF的話,需要先將PDF轉化為圖片,然后再進行識別。
Python
可以安裝3.7及以上版本
tesseract-ocr
下載地址: https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可
需要用到的庫
pip install pillow pip install opencv-python pip install fitz pip install PyMuPDF pip install pytesseract
from PIL import Image import os import pytesseract import cv2 as cv import fitz def pdf_image(pdfPath,imgPath,zoom_x,zoom_y,rotation_angle): # 打開PDF文件 pdf = fitz.open(pdfPath) # 逐頁讀取PDF for pg in range(0, pdf.pageCount): page = pdf[pg] # 設置縮放和旋轉系數 trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotation_angle) pm = page.getPixmap(matrix=trans, alpha=False) # 開始寫圖像 pm.writePNG(imgPath+str(pg)+".png") #pm.writePNG(imgPath) pdf.close() pdf_path ='D:/123.pdf' img_path ='D:/123.png' pdf_image(pdf_path,img_path,5,5,0) # 依賴opencv img=cv.imread(img_path) text=pytesseract.image_to_string(Image.fromarray(img),lang='chi_tra') # 不依賴opencv寫法 # text=pytesseract.image_to_string(Image.open(img_path)) print(text)
以上就是怎么在Python中利用OCR對PDF圖片進行識別,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。