91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

基頻的文字定義以及如何用librosa提取wav文件基頻

發布時間:2022-01-06 18:04:19 來源:億速云 閱讀:391 作者:柒染 欄目:大數據

今天就跟大家聊聊有關基頻的文字定義以及如何用librosa提取wav文件基頻,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

1. 音高和基頻

基頻的文字定義以及如何用librosa提取wav文件基頻

2. 基頻定義

基頻的文字定義以及如何用librosa提取wav文件基頻

基頻的文字定義以及如何用librosa提取wav文件基頻

3. 諧波

泛音(overtones) == 諧波 (Harmonics)

基頻的文字定義以及如何用librosa提取wav文件基頻

根據這個, 可以解耦音色和內容

  • 第一共振峰, 第二共振峰...等的位置, 特別是相對位置, 決定了發音內容TODO需要討論|不同元音對不同倍數泛音共振加強不同, 體現的也有一部分是能量的大小相對差異

  • 基頻的高度, 共振峰的絕對高度, 也一定程度和發音內容相關, 但是需要減掉說話人的平均基頻值, 再去看

  • 人的基頻, 共振峰等的絕對高度, 和音色相關, 比如性別的不同, F0范圍的不同

  • 共振峰的相對位置, 最大的信息時發音內容, 但是相同發音內容, 又會有每個人的發音習慣和口腔結構, 所以次要信息也有音色信息. 這點和speaker identity更像, ASV特征

  • 真正的"厚實, 亮, 尖, 好聽"也算作音色, 但是是同一個人也可以模擬的, 比如單人多角色小說 唱歌等. 不同共振峰頻率分配的能量, 會導致聽感. 人和人之間區別很大, 也可以導致ASV

  • 因此, 1-如果對mel譜每個人, 進行每個頻率獨立的能量的norm(0, 1), 則一定程度能去掉個人的聲音特性, 并且保留發音信息(這個好好想, 涉及到位置和位置的能量)| 這個過程相當于去掉人的口腔特征對特定發音的"人加重"

  • 接著上面的, 2-如果能抽離出每一時刻的f0和各個共振峰, 將這些位置也隨著f0的位置做歸一化, 也能一定程度去掉音色, 并且保留發音信息 | | 這個過程相當于去掉人的聲帶特征對特定發音的"人加重"

提一個問題, 合唱的時候大家都哼"哼", 同一個調, 用此來分析

(

  • 音色:音色的區別是由于各種振動,其總能量在泛音各音級上能量分配不同而造成的。

)

回答:

只讓人哼同一個字, 相當于把人"退化", 或者"類比"為小提琴, 每個人都是小提琴, 但是男的和女的, 男高音和男低音, 是天性不同的小提琴, 對泛音的能量分配就算哼同一個字, 天生分配也不同. 不過差距并不大(相比于哼不同字)罷了

再提一個問題, 男生說的ba和女生說的ba的頻率和共振峰位置一樣么?是不是需要norm之后, 就一樣的, 每個人聲帶的結構和胸腔肌肉力量不同

基頻的文字定義以及如何用librosa提取wav文件基頻

基頻的文字定義以及如何用librosa提取wav文件基頻

基頻的文字定義以及如何用librosa提取wav文件基頻

圖上的水平線含義:水平線表示一個歌手在某個音高上持續了一段時間。越亮的線表示振幅越大,聽感上當然就音量大了

直線就是一個長直音,考察長直音主要看穩定度,整個線越直則這個長音越穩定。如果大抖就是破音,如果小抖就是不穩。如果歪了,那就是音準沒把握好 TODO, 需要討論

波浪線就是顫音。波浪越大則顫音越大。看顫音也是看穩定度,如果顫的不穩就是氣息出現問題,控制不好

3.1. 如何觀察和評價泛音/諧波

基頻的文字定義以及如何用librosa提取wav文件基頻

  • 看泛音主要看三點:豐富與否;分布情況;泛音的音量。對比泛音主要是看與基頻的對比。因為音頻文件的音量是可以調整的,單純的看泛音大小沒多大意義,以基頻為參照才比較有實際意義。(低頻的共鳴情況取決于元音的類型,每一個元音都有自己的特定的共鳴特性。一般來說,基頻被共鳴強化的情況比較少)

  • 此例中第一泛音巨大(看多了就知道,一般都是第一泛音最大),在3000左右的三個泛音也很強

另一種觀察方法就是和伴奏比,人聲線越明顯則人聲越強,越能穿透伴奏. 之后作者有舉例, 我就略了.....偷個懶

基頻的文字定義以及如何用librosa提取wav文件基頻

基頻的文字定義以及如何用librosa提取wav文件基頻

基頻的文字定義以及如何用librosa提取wav文件基頻

4. librosa概述

基頻的文字定義以及如何用librosa提取wav文件基頻

5. librosa提取F0

https://librosa.org/doc/main/generated/librosa.pyin.html

基頻的文字定義以及如何用librosa提取wav文件基頻

y, sr = librosa.load(librosa.ex('trumpet'))
f0, voiced_flag, voiced_probs = librosa.pyin(y, fmin=librosa.note_to_hz('C2'), fmax=librosa.note_to_hz('C7'))
times = librosa.times_like(f0)


import matplotlib.pyplot as plt
D = librosa.amplitude_to_db(np.abs(librosa.stft(y)), ref=np.max)
fig, ax = plt.subplots()
img = librosa.display.specshow(D, x_axis='time', y_axis='log', ax=ax)
ax.set(title='pYIN fundamental frequency estimation')
fig.colorbar(img, ax=ax, format="%+2.f dB")
ax.plot(times, f0, label='f0', color='cyan', linewidth=3)
ax.legend(loc='upper right')

基頻的文字定義以及如何用librosa提取wav文件基頻

看完上述內容,你們對基頻的文字定義以及如何用librosa提取wav文件基頻有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

德州市| 龙江县| 丹棱县| 孟连| 景谷| 绥阳县| 江源县| 贡嘎县| 天全县| 五大连池市| 宁陕县| 瑞安市| 榆中县| 克拉玛依市| 莆田市| 青神县| 元江| 沁水县| 宜春市| 重庆市| 芷江| 衡南县| 高邑县| 沧州市| 东乌珠穆沁旗| 平阴县| 正阳县| 邵阳市| 文成县| 福泉市| 东兴市| 芦溪县| 东乡县| 阿克| 武山县| 九寨沟县| 韶山市| 循化| 和顺县| 鲁甸县| 罗源县|