怎樣識(shí)別視頻中的背景音樂或歌曲?
怎樣識(shí)別視頻中的背景音樂或歌曲?
回復(fù)
我來回復(fù)- beibei8455 評(píng)論
可以使用音樂軟件中的聽歌識(shí)曲功能。在視頻播放時(shí)打開聽歌識(shí)曲,就能識(shí)別出其中的背景音樂和歌曲了?,F(xiàn)在的主流音樂軟件都帶有聽歌識(shí)曲功能,如:qq音樂,酷狗音樂等等。
聽歌識(shí)曲只是音頻指紋檢索中的一種,是人工智能領(lǐng)域自動(dòng)內(nèi)容識(shí)別技術(shù)(Automatic content recognition)的核心算法,與語音識(shí)別將一段用戶的語音轉(zhuǎn)化為文字不同,音頻指紋技術(shù)不區(qū)分語言,是一種聲音對(duì)聲音的精確檢索。
使用竅門 :
把手機(jī)QQ音樂盡量靠近音源,錄取需要識(shí)別的音頻錄音,錄取后由客戶端提取錄音音頻特征發(fā)送到服務(wù)端。服務(wù)端根據(jù)QQ音樂發(fā)上來的音頻特征跟服務(wù)器中的歌曲進(jìn)行遍歷匹配,匹配中哪首歌曲就把歌曲內(nèi)容返回給客戶端。識(shí)曲時(shí)不要大聲講話,盡量保證環(huán)境的安靜,盡量離音源更近,一次只識(shí)別一首歌。
該功能有以下三個(gè)特點(diǎn):
快:打開各大音樂播放器使用該功能,一般只需要一秒至幾秒長(zhǎng)的片段,就可以進(jìn)行查詢搜索歌曲,同時(shí)帶給你動(dòng)態(tài)歌詞快速定位體驗(yàn)。
如,用QQ音樂聽歌識(shí)曲功能,在安靜環(huán)境一般三秒以下,就能根據(jù)音頻片段識(shí)別出對(duì)應(yīng)的歌曲名。
準(zhǔn):該功能有很好的抗噪能力,在一定的嘈雜環(huán)境下也能實(shí)現(xiàn)很好的抗噪能力識(shí)別出對(duì)應(yīng)的背景音樂,并返回精準(zhǔn)的逐字歌詞,方便用戶直觀的判斷出返回結(jié)果是否符合外放音頻。具備精準(zhǔn)的數(shù)據(jù)建模能力,只用較少的數(shù)據(jù)便達(dá)到優(yōu)異的識(shí)別性能;同時(shí)對(duì)海量數(shù)據(jù)處理也有很強(qiáng)的支持能力,綜合識(shí)別精度>99%。
穩(wěn):聽歌識(shí)曲主要運(yùn)用到音頻指紋(Audio Fingerprinting)的算法來提取每首歌的指紋,建立歌曲指紋庫(kù),當(dāng)用戶通過錄音請(qǐng)求的時(shí)候,聽歌識(shí)曲會(huì)先對(duì)這段音樂提取其音頻指紋,再對(duì)該指紋進(jìn)行比對(duì)匹配,找到多語言海量曲庫(kù)中匹配度最高的那首歌,算法和曲庫(kù)相輔相成。QQ音樂是國(guó)內(nèi)識(shí)別率最高的音樂APP之一,能做到市面上99%以上播放的音頻都能搜索到并返回給用戶。
2年前