Python中怎么從圖像中讀取文本

發布時間：2021-07-10 16:11:42 來源：億速云閱讀：182 作者：Leah 欄目：編程語言

本篇文章為大家展示了Python中怎么從圖像中讀取文本，內容簡明扼要并且容易理解，絕對能使你眼前一亮，通過這篇文章的詳細介紹希望你能有所收獲。

OpenCV

現在，這個庫將只用于加載圖像，實際上你不需要事先對它有太多了解(盡管它可能有幫助，你將看到為什么)。

根據官方文件:

OpenCV(開源計算機視覺庫)是一個開源的計算機視覺和機器學習軟件庫。OpenCV的目的是為計算機視覺應用提供一個通用的基礎結構，并加速機器感知在商業產品中的使用。OpenCV是bsd許可的產品，OpenCV使企業可以輕松地使用和修改代碼

簡而言之，你可以使用OpenCV來做任何類型的圖像轉換，這是一個相當簡單的庫。

如果你還沒有安裝它，那么它將只是終端中的一行：

pip install opencv-python

差不多就是這樣。在此之前，一切都很簡單，但這種情況即將改變。

PyTesseract

這個庫到底是什么東西?根據維基百科:

Tesseract是用于各種操作系統的光學字符識別引擎。它是免費軟件，根據Apache許可2.0版發布，自2006年以來由Google贊助開發。

我敢肯定，現在有更多復雜的庫可用，但是我發現這個庫運行良好。根據我自己的經驗，該庫應該能夠從任何圖像中讀取文本，但前提是該字體不會使你連連看都看不懂。

如果無法從你的圖像中讀取文字，花更多的時間使用OpenCV，應用各種過濾器使文本高亮。

現在安裝在底部有些麻煩。如果你使用的是Linux，則全部歸結為幾個sudo-apt get命令：

sudo apt-get updatesudo apt-get install tesseract-ocrsudo apt-get install libtesseract-dev

我用的是Windows系統，所以這個過程有點乏味。

首先，打開這個URL:https://github.com/UB-Mannheim/tesseract/wiki下載32位或64位的安裝程序:

安裝本身很簡單，只需單擊幾次Next。是的，你還需要做一個pip安裝:

pip install pytesseract

接下來要需要告訴Python Tesseract安裝在何處。在Linux機器上，我不需要這樣做，但在Windows上是必需的。默認情況下，它安裝Program Files。

如果你做的一切正確，執行這些代碼應該不會產生任何錯誤:

獲取文本

讓我們從一個簡單的開始。我找到了一些免版稅的圖片，里面有一些文字，第一個是這樣的:

它應該是簡單的一個，有可能Tesseract會讀那些藍色的“對象”作為括號。讓我們看看會發生什么:

我的猜測是正確的。不過，這不是一個問題，你可以使用一些Python技巧輕松地解決這些問題。

下一個可能更棘手:

我希望它不會檢測到硬幣上的“B”:

上述內容就是Python中怎么從圖像中讀取文本，你們學到知識或技能了嗎？如果還想學到更多技能或者豐富自己的知識儲備，歡迎關注億速云行業資訊頻道。

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本