您好,登錄后才能下訂單哦!
本篇文章為大家展示了Python中怎么從圖像中讀取文本,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。
OpenCV
現在,這個庫將只用于加載圖像,實際上你不需要事先對它有太多了解(盡管它可能有幫助,你將看到為什么)。
根據官方文件:
OpenCV(開源計算機視覺庫)是一個開源的計算機視覺和機器學習軟件庫。OpenCV的目的是為計算機視覺應用提供一個通用的基礎結構,并加速機器感知在商業產品中的使用。OpenCV是bsd許可的產品,OpenCV使企業可以輕松地使用和修改代碼
簡而言之,你可以使用OpenCV來做任何類型的圖像轉換,這是一個相當簡單的庫。
如果你還沒有安裝它,那么它將只是終端中的一行:
pip install opencv-python
差不多就是這樣。在此之前,一切都很簡單,但這種情況即將改變。
PyTesseract
這個庫到底是什么東西?根據維基百科:
Tesseract是用于各種操作系統的光學字符識別引擎。它是免費軟件,根據Apache許可2.0版發布,自2006年以來由Google贊助開發。
我敢肯定,現在有更多復雜的庫可用,但是我發現這個庫運行良好。根據我自己的經驗,該庫應該能夠從任何圖像中讀取文本,但前提是該字體不會使你連連看都看不懂。
如果無法從你的圖像中讀取文字,花更多的時間使用OpenCV,應用各種過濾器使文本高亮。
現在安裝在底部有些麻煩。如果你使用的是Linux,則全部歸結為幾個sudo-apt get命令:
sudo apt-get updatesudo apt-get install tesseract-ocrsudo apt-get install libtesseract-dev
我用的是Windows系統,所以這個過程有點乏味。
首先,打開這個URL:https://github.com/UB-Mannheim/tesseract/wiki下載32位或64位的安裝程序:
安裝本身很簡單,只需單擊幾次Next。是的,你還需要做一個pip安裝:
pip install pytesseract
接下來要需要告訴Python Tesseract安裝在何處。在Linux機器上,我不需要這樣做,但在Windows上是必需的。默認情況下,它安裝Program Files。
如果你做的一切正確,執行這些代碼應該不會產生任何錯誤:
獲取文本
讓我們從一個簡單的開始。我找到了一些免版稅的圖片,里面有一些文字,第一個是這樣的:
它應該是簡單的一個,有可能Tesseract會讀那些藍色的“對象”作為括號。讓我們看看會發生什么:
我的猜測是正確的。不過,這不是一個問題,你可以使用一些Python技巧輕松地解決這些問題。
下一個可能更棘手:
我希望它不會檢測到硬幣上的“B”:
上述內容就是Python中怎么從圖像中讀取文本,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。