通過Python的speech_recognition庫將音頻文件轉為文字的方法

發布時間：2023-08-22 15:23:45 來源：億速云閱讀：219 作者：栢白欄目：開發技術

本篇文章和大家了解一下通過Python的speech_recognition庫將音頻文件轉為文字的方法。有一定的參考價值，有需要的朋友可以參考一下，希望對大家有所幫助。

前言

大家好，我是空空star，本篇給大家分享一下通過Python的speech_recognition庫將音頻文件轉為文字。
上一篇已經介紹了相關的庫speech_recognition。

Python-語音轉文字相關庫介紹

一、音頻準備

這里我們通過gTTS先生成一段音頻，gTTS相關的介紹可以看博主之前寫的博客。

通過Python的gtts庫將文字轉為音頻

from gtts import gTTS
local = '/Users/kkstar/Downloads/video/'
text = '大家好，我是空空star，本篇給大家分享一下音頻轉文字，這是通過speech_recognition轉換的文字。'
language = "zh-cn"
tts = gTTS(text=text, lang=language)
tts.save(local+"audio_gtts_0509.mp3")

二、音頻聲音

音頻轉文字_0509

三、格式轉換

mp3轉為wav。
這里不能只改后綴，需要用音頻轉換工具轉換下。
audio_gtts_0509.mp3->audio_gtts_0509.wav

四、音頻轉文字

1.引入庫

import speech_recognition as sr
import speech_recognition as sr

2.定義音頻路徑

local = '/Users/kkstar/Downloads/video/'

3.創建一個Recognizer對象

r = sr.Recognizer()

4.打開音頻文件，將音頻文件讀入Recognizer對象

音頻文件必須是wav的格式

# 打開音頻文件
with sr.AudioFile(local+'audio_gtts_0509.wav') as source:
    # 將音頻文件讀入Recognizer對象
    audio = r.record(source)

5.嘗試使用Google Web API將語音轉換為文字

try:
    text = r.recognize_google(audio, language='zh-CN')
    print('轉換結果：', text)
except sr.UnknownValueError:
    print('無法識別語音')
except sr.RequestError as e:
    print('無法連接到Google Web API. {0}'.format(e))

6.轉換結果

轉換結果：大家好我是空空Store本篇給大家分享一下音頻轉文字這是通過Keep下劃線recognition轉換的文字
Process finished with exit code 0

總結

recognize_google： recognize_google() 是Google提供的一種語音識別API，可以識別音頻文件或麥克風錄制的語音，并將其轉換為文本。在Python中，可以使用SpeechRecognition庫中的recognize_google()方法來調用該API。

以上就是通過Python的speech_recognition庫將音頻文件轉為文字的方法的簡略介紹，當然詳細使用上面的不同還得要大家自己使用過才領會。如果想了解更多，歡迎關注億速云行業資訊頻道哦！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

通過Python的speech_recognition庫將音頻文件轉為文字的方法

前言

一、音頻準備

二、音頻聲音

三、格式轉換

四、音頻轉文字

1.引入庫

2.定義音頻路徑

3.創建一個Recognizer對象

4.打開音頻文件，將音頻文件讀入Recognizer對象

5.嘗試使用Google Web API將語音轉換為文字

6.轉換結果

總結

猜你喜歡

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

通過Python的speech_recognition庫將音頻文件轉為文字的方法

前言

一、音頻準備

二、音頻聲音

三、格式轉換

四、音頻轉文字

1.引入庫

2.定義音頻路徑

3.創建一個Recognizer對象

4.打開音頻文件，將音頻文件讀入Recognizer對象

5.嘗試使用Google Web API將語音轉換為文字

6.轉換結果

總結

猜你喜歡

最新資訊

相關推薦

相關標簽