?????? 由日本株式會(huì )社PFU和PFU上海計算機有限公司聯(lián)合開(kāi)發(fā)的基于深度學(xué)習的“環(huán)境音識別系統”參加了IEEE官方指定的國際大賽DCASE2018 Challenge的Task4的競賽,在50個(gè)參賽系統中脫穎而出,取得了第一名的佳績(jì)。
????? DCASE2018 Challenge是IEEE指定的AASP(Audio and Acoustic Signal Processing) Challenge大賽的一部分,也是IEEE官方指定的音頻和聲學(xué)信號處理的國際性權威競賽。Task4是“Large-scale weakly labeled semi-supervised sound event detection in domestic environments”,也就是“在室內環(huán)境中的大尺度弱標簽半監督聲音事件檢測”。今年的競賽內容是在給定一段室內環(huán)境中的音頻(包括了人的聲音,貓和狗的叫聲,警報聲,吸塵器的聲音,刮胡子的聲音,油炸食物的聲音等等)中識別出從第幾秒開(kāi)始到第幾秒結束有哪種類(lèi)型的聲音。
????? PFU上海團隊參加了上述的競賽,在與北京清華、中國科技大學(xué)、上海交大等國內知名大學(xué),以及美國約翰·霍普金斯大學(xué)、奧地利格拉茨大學(xué)、韓國電子通信研究院、印度理工學(xué)院等諸多海外研究機構的同臺競技中,取得了第一名的優(yōu)異成績(jì)。準確率比第二名大幅高出2.5%,比基準高出21.6%。
????? 近年來(lái)深度學(xué)習(Deep Learning)技術(shù)飛速發(fā)展,PFU上海團隊時(shí)刻緊盯最前沿技術(shù)的變化,通過(guò)不斷鉆研及運用,在神經(jīng)網(wǎng)絡(luò )技術(shù)方面積累了豐富的經(jīng)驗,具備了很強的實(shí)踐能力。在這次競賽中,PFU上海團隊充分利用了多年來(lái)對各種神經(jīng)網(wǎng)絡(luò )技術(shù)研究的經(jīng)驗,準確選取了最適合音頻處理的神經(jīng)網(wǎng)絡(luò )的算法,提高了提取語(yǔ)音的聲學(xué)特征的準確率,為最后的優(yōu)勝奠定了堅實(shí)的基礎。而且在傳統模型無(wú)法處理的弱標簽數據上,嘗試并挑戰了多種最前沿的新模型來(lái)訓練以前傳統模型無(wú)法處理的弱標簽數據,通過(guò)上下文關(guān)聯(lián)技術(shù)進(jìn)一步強化了聲學(xué)特征,在這些新技術(shù)的運用方面,取得了新的突破。
?????? 今后, PFU上海團隊將繼續深耕AI領(lǐng)域,不斷挑戰,勇攀新的高峰。