您好,登錄后才能下訂單哦!
這期內容當中小編將會給大家帶來有關Python中如何實現文字識別功能,文章內容豐富且以專業的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
環境和配置要求
整體是用Python實現,所需要使用的第三方庫包括aip、PIL、keyboard、pyinstaller,如未安裝,可在CMD中使用pip install Baidu-AIP/pillow/keyboard/pyinstaller
指令安裝。
打開https://cloud.baidu.com/,
如未注冊請先注冊,然后登錄點擊管理控制臺,點擊左側產品服務→人工智能→文字識別,點擊創建應用,輸入應用名稱如Baidu_OCR,選擇用途如學習辦公,最后進行簡單應用描述,即可點擊立即創建。
會出現應用列表,包括AppID、API Key、Secret Key等信息,這些稍后會用到。
整個程序的大致思路是,在用截圖軟件獲得截圖之后,交給百度接口識別,并返回結果,當然,也可以是本地圖片識別,我用的是QQ自帶截圖軟件,快捷鍵CTRL+ALT+A
用來打開截圖,在選中所截區域后,按Enter鍵即可保存到粘貼板中,也可用其他截圖軟件。
keyboard類庫是用來監聽鍵盤動作的,所以在有快捷鍵按下之后,便會有相應動作。并用PIL中的ImageGrab來獲取到剪切板中的圖片并生成本地圖片文件。
#1.截圖
keyboard.wait('ctrl+alt+a')
print('開始截圖')
keyboard.wait('enter')
print('保存截圖')
time.sleep(0.1)
#2.保存圖片
image = ImageGrab.grabclipboard()
image.save('img.png')
先用注冊時生成的應用的AppID、API Key、Secret Key初始化應用,再讀取保存到的圖片并打印識別的文字。
with open('img.png', 'rb') as fp:
image = fp.read()
text_list = client.basicAccurate(image)['words_result']
for text in text_list:
print(text['words'])
運行結果如圖所示:
上述就是小編為大家分享的Python中如何實現文字識別功能了,如果剛好有類似的疑惑,不妨參照上述分析進行理解。如果想知道更多相關知識,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。