Python3如何實現圖片文字識別

發布時間：2021-07-26 13:42:31 來源：億速云閱讀：206 作者：小新欄目：開發技術

這篇文章將為大家詳細講解有關Python3如何實現圖片文字識別，小編覺得挺實用的，因此分享給大家做個參考，希望大家閱讀完這篇文章后可以有所收獲。

沒想到Python實現圖片文字識別這么簡單，只需要一行代碼就能搞定

from PIL import Image
import pytesseract
#上面都是導包，只需要下面這一行就能實現圖片文字識別
text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')
print(text)

我們以識別詩詞為例

下面是我們要識別的圖片

Python3如何實現圖片文字識別

先看下效果圖

Python3如何實現圖片文字識別

我們運行代碼后識別的結果,有幾個字沒有正確識別，但是大多數字都能識別出來。

風急天高猿嘯哀 渚蕓胄芳少白鳥飛鳳
無邊落木蕭蕭下, 不盡長量工盲袞宕袞來
萬里悲秋常1乍窨, 百年多病獨登氤
艱難苦恨擎霜量 漂倒新停澍酉帆

一行代碼就能識別圖片，我們背后要做些準備工作的

這里我們需要用到兩個庫：pytesseract和PIL
同時我們還需要安裝識別引擎tesseract-ocr

下面就來講講這幾個庫的安裝，因為只有這幾個庫安裝好以后Python才能實現一行代碼實現圖片文字識別

一，pytesseract和PIL的安裝

安裝這兩個包可以借助pip

- 1，命令行安裝

pip install PIL 
pip install pytesseract

- 2，如果你用的pycharm編輯器，就可以直接借助pycharm實現快速安裝。

在pycharm的Settings設置頁按照下面步驟操作

Python3如何實現圖片文字識別

這樣就能成功安裝pytesseract，安裝PIL只需要在上面第三步里搜索PIL并點擊安裝即可

Python3如何實現圖片文字識別

這時我們安轉好了庫，運行下面代碼

from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('denggao.jpeg'),lang='chi_sim')
print(text)

會報下面錯誤，錯誤原因是：沒有安裝識別引擎tesseract-ocr

Python3如何實現圖片文字識別

二，安裝識別引擎tesseract-ocr

1.下載下面的安裝包，然后直接點擊安裝即可
tesseract-ocr安裝包和中文語言包

解壓安裝tesseract-ocr后做如下操作，就可以支持中文識別了。因為tesseract-ocr默認不支持中文識別。

Python3如何實現圖片文字識別

2，安裝完成tesseract-ocr后，我們還需要做一下配置

在C:\Users\huxiu\AppData\Local\Programs\Python\Python35\Lib\site-packages\pytesseract找到pytesseract.py打開后做如下操作

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

也可以通過pycharm快速打開pytesseract.py

Python3如何實現圖片文字識別

至此我們所有的配置就完成了，運行下面代碼就可以把杜甫的登高這首圖片詩解析成文字了

Python3如何實現圖片文字識別

關于“Python3如何實現圖片文字識別”這篇文章就分享到這里了，希望以上內容可以對大家有一定的幫助，使各位可以學到更多知識，如果覺得文章不錯，請把它分享出去讓更多的人看到。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

Python3如何實現圖片文字識別

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

Python3如何實現圖片文字識別

猜你喜歡

最新資訊

相關推薦

相關標簽