五大趨勢總結(jié) 帶你看清聲紋識別技術(shù)研究方向

2019-10-30 1930

核心提示：走出實(shí)驗(yàn)室的聲紋識別技術(shù)因其廣闊的應(yīng)用場景和價值罐脊，從特定領(lǐng)域到民用領(lǐng)域炕婶，在國內(nèi)外正迎來第一波商用化浪潮兜蠕。而與此同時，關(guān)

走出實(shí)驗(yàn)室的聲紋識別技術(shù)因其廣闊的應(yīng)用場景和價值厚柳，從特定領(lǐng)域到民用領(lǐng)域氧枣，在國內(nèi)外正迎來第一波商用化浪潮。而與此同時别垮，關(guān)于聲紋識別技術(shù)研究的成熟度以及安全可靠性便监，一直是應(yīng)用領(lǐng)域討論的重點(diǎn)，本文基于時下聲紋識別技術(shù)研究的前沿觀點(diǎn)碳想，總結(jié)出五大發(fā)展趨勢：

　　1烧董、聲紋識別研究朝著深度學(xué)習(xí)和端到端方向發(fā)展

　　語音作為語言的聲音表現(xiàn)形式，不僅包含了語言語義信息移袍，同時也傳達(dá)了說話人語種解藻、性別、年齡葡盗、情感螟左、信道、嗓音觅够、病理胶背、生理、心理等多種豐富的副語言語音屬性信息尽由。以上這些語言語音屬性識別問題從整體來看爹蒋，其核心都是針對不定時長文本無關(guān)的句子層面語音信號的有監(jiān)督學(xué)習(xí)問題，只是要識別的屬性標(biāo)注有不同野戏。

　　近年來遵非，聲紋識別的研究趨勢正在快速朝著深度學(xué)習(xí)和端到端方向發(fā)展，其中最典型的就是基于句子層面的做法哺挺。在網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)华媳、數(shù)據(jù)增強(qiáng)、損失函數(shù)設(shè)計(jì)等方面還有很多工作去做暴姓，還有很大的提升空間娇紊。

　　2、提升聲紋識別系統(tǒng)的短時語音情況

　　在實(shí)際應(yīng)用中湿儡，由于對基于語音的訪問控制需求的不斷增長触茎，提升聲紋識別系統(tǒng)在短時語音情況下的性能變得尤為迫切。短時語音中說話人信息不足以及注冊和測試語音的文本內(nèi)容不匹配处榔，對于主流的基于統(tǒng)計(jì)建模的聲紋識別系統(tǒng)是一個嚴(yán)峻的挑戰(zhàn)希俩。

　　3、改進(jìn)現(xiàn)有的深度說話人學(xué)習(xí)方法

　　目前采用的深度說話人識別方法首先利用神經(jīng)網(wǎng)絡(luò)提取前端的幀級特征诬留，然后通過池化映射獲得可以表示說話人特性的段級向量斜纪，最后采用 LDA/PLDA 等后端建模方法進(jìn)行度量計(jì)算。

　　相對于傳統(tǒng)的 i-vector 生成過程文兑，基于深度學(xué)習(xí)的說話人識別方法優(yōu)勢主要體現(xiàn)在區(qū)分性訓(xùn)練和利用多層網(wǎng)絡(luò)結(jié)構(gòu)對局部多幀聲學(xué)特征的有效表示上盒刚。如何進(jìn)一步改進(jìn)現(xiàn)有的深度說話人學(xué)習(xí)方法是現(xiàn)階段的一個研究熱點(diǎn)。

　　4绿贞、深度對抗學(xué)習(xí)在聲紋識別技術(shù)中的應(yīng)用

　　生成式對抗網(wǎng)絡(luò) (GAN) 的主要目的是用在數(shù)據(jù)生成因块、降噪、等很多場景里面籍铁。它還被用在領(lǐng)域自適應(yīng)里面涡上，形成一個新的分布。第三個廣泛的應(yīng)用是生成對抗樣本拒名，這會對分類系統(tǒng)產(chǎn)生大的困擾吩愧。很多研究者用對抗樣本攻擊機(jī)器學(xué)習(xí)的系統(tǒng)芋酌，在原始數(shù)據(jù)上增加一些擾動，生成樣本慎瓮，經(jīng)過神經(jīng)網(wǎng)絡(luò)之后就有可能識別成完全不同的結(jié)果菜臣。這個思想在圖像處理領(lǐng)域非常活躍捧法，會造成錯誤識別萄天，引起了自動駕駛，安全等領(lǐng)域的研究人員的廣泛關(guān)注裹五。

　　在語音領(lǐng)域卦须，GAN 可以用在語音識別、口音自適應(yīng)上捅县，通過多任務(wù)學(xué)習(xí)和梯度反轉(zhuǎn)層來進(jìn)行口音或信道的自適應(yīng)摊壳，然后加上其他方法可以得到較好的效果。聲紋識別也存在各種不匹配的問題猪晰，在聲紋識別上也可以使用這一思想悯歇。同樣的思想也用在了 TTS 語音合成領(lǐng)域，目的是把不同的音素解耦成說話人质法，風(fēng)格等风捌，去除噪聲對建模的影響。

　　5妄迁、深度嵌入學(xué)習(xí)是進(jìn)行聲紋識別和反欺騙的一個重要途徑

　　說話人識別和欺騙檢測近年來受到學(xué)術(shù)界和業(yè)界的廣泛關(guān)注寝蹈，人們希望在實(shí)際應(yīng)用中設(shè)計(jì)出高性能的系統(tǒng)〉翘裕基于深度學(xué)習(xí)的方法在該領(lǐng)域得到了廣泛的應(yīng)用箫老，在說話人識別和反欺騙方面取得了新的里程碑。然而黔州，在真實(shí)復(fù)雜的場景下耍鬓，面對短語音、噪聲的破壞流妻、信道失配牲蜀、大規(guī)模等困難，開發(fā)一個魯棒的系統(tǒng)仍然是非常困難的绅这。深度嵌入學(xué)習(xí)是進(jìn)行說話人識別和反欺騙的一個重要途徑涣达，在這方面已有一些著名的研究成果。如之前的 d-vector 特征和當(dāng)前普遍使用的 x-vector 特征证薇。

　　結(jié)語：目前度苔，指紋識別、人臉識別已經(jīng)被大眾所熟知猬肖，但同樣作為生物識別的聲紋識別余窖，還處于技術(shù)挑戰(zhàn)的前沿地帶猾妖。據(jù)聲紋識別企業(yè)快商通分析，當(dāng)下全球生物識別產(chǎn)業(yè)規(guī)模龐大森片，僅聲紋識別這一細(xì)分方向的市場規(guī)模就將近百億美元兵雪，預(yù)計(jì)2020年更是有望超過200億美元(合1346億元人民幣)，占整個生物識別市場的22.4%屋迄。

　　以國內(nèi)公共安全領(lǐng)域?yàn)槔膊棵嫦蛉珖茝V聲紋技術(shù)易仍，與指紋庫答海、DNA庫類似，聲紋庫建設(shè)是一項(xiàng)有著重要實(shí)戰(zhàn)價值的工作绵盔，具體表現(xiàn)在聲紋特征具有非接觸式采集的優(yōu)點(diǎn)壁万，和已有DNA庫、指紋庫相結(jié)合璃璧，可形成立體生物特征庫荔鸵，建成后直接為多警種服務(wù)，是利用高科技手段在偵破案件和訴訟活動中應(yīng)用的一個新的增長點(diǎn)踊跟，將能有效提高公安機(jī)關(guān)偵查破案的效率和能力踩验，成為落實(shí)科技強(qiáng)警的重要實(shí)踐之一。目前商玫，公安部已在聲紋庫建設(shè)方面進(jìn)行了重點(diǎn)布局箕憾，并選擇快商通等通過公安部標(biāo)準(zhǔn)檢測的廠商作為聲紋采集設(shè)備提供方，力求雙發(fā)共同完成這項(xiàng)專業(yè)技術(shù)性強(qiáng)拳昌、應(yīng)用領(lǐng)域廣袭异、建設(shè)難度大的系統(tǒng)工程。

點(diǎn)贊 0舉報(bào)收藏 0打賞 0評論 0

免責(zé)聲明

?: 本文為小編互聯(lián)網(wǎng)轉(zhuǎn)載作品炬藤，作者: 小編御铃。歡迎轉(zhuǎn)載，轉(zhuǎn)載請注明原文出處：http://www.yue326.com/news/show-21070.html 沈矿。本網(wǎng)站部分內(nèi)容來源于合作媒體上真、企業(yè)機(jī)構(gòu)、網(wǎng)友提供和互聯(lián)網(wǎng)的公開資料等羹膳，僅供參考谷羞。本網(wǎng)站對站內(nèi)所有資訊的內(nèi)容、觀點(diǎn)保持中立簿馍，不對內(nèi)容的準(zhǔn)確性脯黎、可靠性或完整性提供任何明示或暗示的保證。如果有侵權(quán)等問題忆帐，請及時聯(lián)系我們兵正，我們將在收到通知后第一時間妥善處理該部分內(nèi)容橱墨。582117289@qq.com。

更多>同類防護(hù)頭條

admin
加關(guān)注0
~~沒有留下簽名~~~~

推薦圖文

煙臺將建設(shè)緊密型城市	我國將做好基本醫(yī)療保
淄博在崛起\|“你平安	金昌市消防救援支隊(duì)金

推薦防護(hù)頭條

點(diǎn)擊排行

手機(jī)掃一掃

快速投稿

你可能不是行業(yè)專家猿异，但你一定有獨(dú)特的觀點(diǎn)和視角蚓夺，趕緊和業(yè)內(nèi)人士分享吧！

我要投稿

投稿須知

• 完善綜合交通運(yùn)輸系統(tǒng)捕砖，加快建設(shè)交通強(qiáng)國——新	• CAME2021常熟@智縫時代
• 西北最大交通展—2021新疆國際交通產(chǎn)業(yè)博覽會	• 重磅泡快！應(yīng)急管理工作干得好有獎勵！
• 河北建支鑄造--實(shí)力牛企，再次邀您相聚CZFE2021	• 世衛(wèi)組織更新口罩使用指南
• 澳政府斥巨資開發(fā)新冠追蹤APP溯饵，原來是為了收集	• 吳尊友：喀什疫情源頭是境外集裝箱锨用，無癥狀感染
• 國藥集團(tuán)已提交新冠疫苗上市申請鐘南山：國產(chǎn)	• 你是在減脂增拥，還是減壽啄巧？

成人H动漫在线看,天美无码成人在线,桃色视频高中生成人,成人免费无码大片a毛视频

VIP

推廣服務(wù)

增值服務(wù)

五大趨勢總結(jié) 帶你看清聲紋識別技術(shù)研究方向