ディープラーニングに基づく音聲認識技術(shù)
お問(wèn)い合わせ
音響特性から、音聲は言語(yǔ)音、音楽、環(huán)境音の三つに分類(lèi)されます。
現在主流の音聲認識や聲紋認識技術(shù)は音聲信號処理に向けたものであり、技術(shù)は比較的成熟しています。
PFU上海グループは長(cháng)い間、環(huán)境音のAI認識技術(shù)研究開(kāi)発に取り組んでいます。
特定の音を判別したい応用シーンに対しては、事前に音サンプルを採取して、AIのディープラーニングとトレーニングを行い、
AI環(huán)境音認識エンジンに自ら學(xué)習させ、最終的には実際の現場(chǎng)で、特定種類(lèi)の音を認識し、選別することができます。
人工知能の國際的権威コンテストであるDCASE 2018で総合優(yōu)勝したことがあります(音聲認識領(lǐng)域)。
複雑な環(huán)境の音を判別し分類(lèi)することができます。
(あらかじめ判別した音聲を學(xué)習しておく必要があり、1つの音聲につき約200個(gè)の音聲サンプルが必要となります。)
【DCASE2018 Task4 世界1位】
異常音検知
異音を起こすことが難しい場(chǎng)合に、
正常時(shí)の音を學(xué)習させる事で「普段と異なる音」を検知する技術(shù)です。
【DCASE2020 Task2 世界第6位】
道路の安全と密接に関連する3つの音聲をAI認識します。
音聲のAI認識と映像監視による畫(huà)像解析を組み合わせ、
従來(lái)の畫(huà)像認識だけでは解決できなかった課題を解決します。
以上の六つの機械音に異常音が含まれるかどうかを予測し、
計測技術(shù)は実際の現場(chǎng)業(yè)務(wù)への適用性が高いです!
ディープラーニングに基づく音聲認識技術(shù)
お問(wèn)い合わせ