您好,登錄后才能下訂單哦!
本篇文章和大家了解一下通過Python的speech_recognition庫將音頻文件轉為文字的方法。有一定的參考價值,有需要的朋友可以參考一下,希望對大家有所幫助。
大家好,我是空空star,本篇給大家分享一下通過Python的speech_recognition庫將音頻文件轉為文字。
上一篇已經介紹了相關的庫speech_recognition
。
Python-語音轉文字相關庫介紹
這里我們通過gTTS先生成一段音頻,gTTS相關的介紹可以看博主之前寫的博客。
通過Python的gtts庫將文字轉為音頻
from gtts import gTTS local = '/Users/kkstar/Downloads/video/' text = '大家好,我是空空star,本篇給大家分享一下音頻轉文字,這是通過speech_recognition轉換的文字。' language = "zh-cn" tts = gTTS(text=text, lang=language) tts.save(local+"audio_gtts_0509.mp3")
音頻轉文字_0509
mp3轉為wav。
這里不能只改后綴,需要用音頻轉換工具轉換下。
audio_gtts_0509.mp3->audio_gtts_0509.wav
import speech_recognition as sr import speech_recognition as sr
local = '/Users/kkstar/Downloads/video/'
r = sr.Recognizer()
音頻文件必須是wav的格式
# 打開音頻文件 with sr.AudioFile(local+'audio_gtts_0509.wav') as source: # 將音頻文件讀入Recognizer對象 audio = r.record(source)
try: text = r.recognize_google(audio, language='zh-CN') print('轉換結果:', text) except sr.UnknownValueError: print('無法識別語音') except sr.RequestError as e: print('無法連接到Google Web API. {0}'.format(e))
轉換結果: 大家好我是空空Store本篇給大家分享一下音頻轉文字這是通過Keep下劃線recognition轉換的文字
Process finished with exit code 0
recognize_google
: recognize_google() 是Google提供的一種語音識別API,可以識別音頻文件或麥克風錄制的語音,并將其轉換為文本。在Python中,可以使用SpeechRecognition庫中的recognize_google()方法來調用該API。
以上就是通過Python的speech_recognition庫將音頻文件轉為文字的方法的簡略介紹,當然詳細使用上面的不同還得要大家自己使用過才領會。如果想了解更多,歡迎關注億速云行業資訊頻道哦!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。