python特征提取的方法有哪些 聲音識(shí)別系統(tǒng)是根據(jù)什么原理制成的?
聲音識(shí)別系統(tǒng)是根據(jù)什么原理制成的?像大多數(shù)識(shí)別問(wèn)題一樣,音頻識(shí)別分為幾個(gè)步驟:1.特征提取2。索引數(shù)據(jù)庫(kù)3。搜索和模糊匹配4。識(shí)別結(jié)果的拼接特征提取算法很多,基于FFT的頻域信息比較簡(jiǎn)單,值得進(jìn)一步研
聲音識(shí)別系統(tǒng)是根據(jù)什么原理制成的?
像大多數(shù)識(shí)別問(wèn)題一樣,音頻識(shí)別分為幾個(gè)步驟:
1.特征提取2。索引數(shù)據(jù)庫(kù)3。搜索和模糊匹配4。識(shí)別結(jié)果的拼接特征提取算法很多,基于FFT的頻域信息比較簡(jiǎn)單,值得進(jìn)一步研究。頻域信號(hào)提取出來(lái)后,因?yàn)轭l帶太多,一般需要合并成幾個(gè)大的頻帶。
比如飛利浦 算法是合并成32個(gè)頻段。我之前做的系統(tǒng)是合并成6個(gè)頻段,Shazam s是4個(gè)頻帶。特征的好壞直接影響識(shí)別效果,需要反復(fù)優(yōu)化。
特征提取出來(lái)后,需要建立一個(gè)索引庫(kù)來(lái)存儲(chǔ)所有的特征,每個(gè)特征要對(duì)應(yīng)一部分實(shí)際內(nèi)容。
事實(shí)上,索引數(shù)據(jù)庫(kù)往往非常大,因此通常不使用普通的關(guān)系數(shù)據(jù)庫(kù)。我用了redis和python dict。因?yàn)椴樵兲l繁,盡量不要上網(wǎng)。我之前做了一個(gè)系統(tǒng),一個(gè)24小時(shí)的音頻,數(shù)據(jù)庫(kù)上的特征查詢次數(shù)是幾十億到幾百億。上網(wǎng)是不可想象的。
搜索過(guò)程就麻煩多了,因?yàn)槭嵌嗝襟w數(shù)據(jù)。
具體來(lái)說(shuō),需要設(shè)計(jì)一種模糊匹配方法。很多因素都會(huì)導(dǎo)致提取的特征與原始特征之間產(chǎn)生誤差,所以需要想辦法減小誤差對(duì)結(jié)果的影響。
比如FFT分段的過(guò)程會(huì)引入高頻噪聲,50Hz的工頻也會(huì)引入噪聲,所以我取FFT頻段一般選擇64~3300Hz的范圍。
在模糊匹配方面,可以使特征中的每一個(gè)值/-1,然后生成很多子特征在索引數(shù)據(jù)庫(kù)中查詢。
上面的識(shí)別結(jié)果只是一些點(diǎn),也就是說(shuō)這個(gè)點(diǎn)匹配了一些結(jié)果,往往會(huì)有很多結(jié)果。
這時(shí)候就要把點(diǎn)連成段才是有意義的結(jié)果。
例如,如果你認(rèn)識(shí)三個(gè)單詞,中間的那個(gè)可以 你聽(tīng)不見(jiàn)我嗎?你#34,并且索引數(shù)據(jù)庫(kù)已經(jīng)包含句子#34我愛(ài)你#34。那么從這些應(yīng)該可以推斷出,有一定的概率結(jié)果與索引數(shù)據(jù)庫(kù)中的結(jié)果相同。
實(shí)際建立概率模型也是一個(gè)巨大的麻煩。中間跳過(guò)的不明點(diǎn)數(shù)量也是經(jīng)驗(yàn)數(shù)據(jù)。
比如我試了一個(gè)點(diǎn)1/8秒,跳過(guò)六個(gè)點(diǎn)會(huì)產(chǎn)生很多誤識(shí)別,但是跳過(guò)兩個(gè)點(diǎn)會(huì)比不跳的識(shí)別率高很多。
我在過(guò)去的兩年里設(shè)計(jì)了一個(gè)音頻識(shí)別系統(tǒng),包括上面所有的組件,用來(lái)識(shí)別電視節(jié)目中的廣告。
在高峰期,索引庫(kù)中大約有1000小時(shí)的音頻。正確識(shí)別率在95%-98%之間波動(dòng),錯(cuò)誤識(shí)別率在2%-3%之間波動(dòng)。
輸入24小時(shí)音頻的識(shí)別時(shí)間約為5~10分鐘。
數(shù)據(jù)分析方法有哪些?
想更好的了解傳統(tǒng)數(shù)據(jù)和大數(shù)據(jù)的區(qū)別,去哪里找數(shù)據(jù),可以用什么技術(shù)處理數(shù)據(jù)?
這些在處理數(shù)據(jù)時(shí)是必要的。邁出第一步,所以這是一個(gè)很好的起點(diǎn),尤其是如果你正在考慮從事數(shù)據(jù)科學(xué)的職業(yè)!
"數(shù)據(jù)與信息是一個(gè)寬泛的術(shù)語(yǔ),可以指 "原始事實(shí)和證據(jù), "處理過(guò)的數(shù)據(jù)和or "信息與廣告。為了確保我們?cè)谕豁?yè)上,讓 讓我們?cè)谶M(jìn)入細(xì)節(jié)之前把它們分開(kāi)。
我們收集原始數(shù)據(jù),然后對(duì)其進(jìn)行處理以獲得有意義的信息。
嗯,它 分開(kāi)它們很容易!
現(xiàn)在,讓我們 讓我們進(jìn)入細(xì)節(jié)吧!