亚洲综合原千岁中文字幕_国产精品99久久久久久久vr_无码人妻aⅴ一区二区三区浪潮_成人h动漫精品一区二区三

主頁 > 知識(shí)庫(kù) > 微軟:語音識(shí)別技術(shù)突飛猛進(jìn)

微軟:語音識(shí)別技術(shù)突飛猛進(jìn)

熱門標(biāo)簽:懷仁縣地圖標(biāo)注app 百度地圖標(biāo)注點(diǎn)修改 微信小程序地圖標(biāo)注信息 電話機(jī)器人如何用 外呼系統(tǒng)支持手機(jī)的 楚雄電銷 徐州電銷智能機(jī)器人銷售公司 德州真人電銷機(jī)器人供應(yīng)商 聯(lián)通400電話網(wǎng)上申請(qǐng)

  2011年國(guó)際語音通訊協(xié)會(huì)第12次年會(huì)(Interspeech 2011)于8月28日至31日在意大利佛羅倫薩舉行。來自微軟研究院的研究人員在會(huì)上發(fā)表了他們的研究成果,這些成果極大地提升了非特定人實(shí)時(shí)語音識(shí)別系統(tǒng)的潛力。

  來自微軟雷德蒙研究院的研究員俞棟博士以及來自微軟亞洲研究院的高級(jí)研究員兼研究經(jīng)理Frank Seide是這項(xiàng)研究的帶頭人,兩支團(tuán)隊(duì)精誠(chéng)合作,在基于人工神經(jīng)網(wǎng)絡(luò)的大詞匯量語音識(shí)別研究中取得了重大突破。


  語音識(shí)別研究的終極目標(biāo)

  語音-文本轉(zhuǎn)換(voice-to-text)軟件和自動(dòng)電話服務(wù)等應(yīng)用背后的關(guān)鍵技術(shù)是語音識(shí)別,該技術(shù)廣泛地應(yīng)用在呼叫中心。在這些應(yīng)用中語音識(shí)別準(zhǔn)確率是至關(guān)重要的,而為了做到這一點(diǎn),語音-文本轉(zhuǎn)換軟件通常要求用戶在安裝過程中對(duì)軟件進(jìn)行訓(xùn)練”,軟件本身也要隨著時(shí)間的推移慢慢適應(yīng)用戶的語音模式。需要與多個(gè)說話者互動(dòng)的自動(dòng)語音服務(wù)則不允許存在使用者對(duì)軟件進(jìn)行訓(xùn)練的環(huán)節(jié),因?yàn)樗鼈儽仨毮軌蛟诘谝粫r(shí)間為任何用戶服務(wù)。為了解決識(shí)別準(zhǔn)確率較低的問題,這些系統(tǒng)要么只能處理很小的詞匯量,要么嚴(yán)格限制用戶可以使用的字句或模式。

  自動(dòng)語音識(shí)別的最終目標(biāo)是提供即買即用、可以自動(dòng)快速適應(yīng)任何說話者的語音識(shí)別服務(wù),這個(gè)系統(tǒng)不需要用戶訓(xùn)練就可以針對(duì)所有用戶和各種條件,良好地發(fā)揮功用。

  這個(gè)目標(biāo)在移動(dòng)互聯(lián)網(wǎng)時(shí)代顯得尤為重要,” 俞棟博士表示:因?yàn)檎Z音是智能手機(jī)和其他移動(dòng)設(shè)備必不可缺的接口模式。雖然個(gè)人移動(dòng)設(shè)備是采集和學(xué)習(xí)用戶語音的理想設(shè)備,但用戶只有在初始體驗(yàn),也就是在針對(duì)該用戶的模型建立之前的體驗(yàn)非常良好時(shí),才會(huì)繼續(xù)使用語音功能。”

  非特定人語音識(shí)別技術(shù)對(duì)于沒有機(jī)會(huì)或辦法適應(yīng)用戶的語音識(shí)別系統(tǒng)也非常重要,例如在呼叫中心,來電者身份是未知的,而且通話時(shí)間只有幾秒鐘;又例如用戶可能會(huì)因?yàn)閾?dān)心隱私問題而不愿意在提供語音-語音(speech-to-speech)”翻譯的網(wǎng)絡(luò)服務(wù)中留存語音樣本。

  重燃對(duì)神經(jīng)網(wǎng)絡(luò)的興趣

  自20世紀(jì)50年代以來,人工神經(jīng)網(wǎng)絡(luò)(ANNs),也就是人類大腦低級(jí)回路的數(shù)學(xué)模型,就已經(jīng)為人們所熟知。利用人工神經(jīng)網(wǎng)絡(luò)改善語音識(shí)別性能的想法早在20世紀(jì)80年代就已出現(xiàn),而且一項(xiàng)名為人工神經(jīng)網(wǎng)絡(luò)-隱馬爾可夫混合模型(ANN - HMM)的技術(shù)顯示了其在大詞匯量語音識(shí)別中的潛力。那么,為什么商用語音識(shí)別系統(tǒng)反而不采納人工神經(jīng)網(wǎng)絡(luò)技術(shù)呢?

  這一切都?xì)w結(jié)于性能,” 俞棟博士解釋道:在針對(duì)傳統(tǒng)的上下文相關(guān)的高斯混合模型-隱馬爾可夫模型(CD-GMM-HMMs)區(qū)分性訓(xùn)練算法發(fā)明后,高斯混合模型-隱馬爾可夫模型的精度得到了提升,并在大詞匯量語音識(shí)別方面的表現(xiàn)超過了人工神經(jīng)網(wǎng)絡(luò)模型。”

  俞棟博士以及微軟雷德蒙研究院語音組的成員們對(duì)人工神經(jīng)網(wǎng)絡(luò)模型重新燃起興趣,是因?yàn)樽罱谟?xùn)練更加復(fù)雜的深層神經(jīng)網(wǎng)絡(luò)(DNNs)方面取得了新的進(jìn)展,這些進(jìn)展使得基于人工神經(jīng)網(wǎng)絡(luò)的自動(dòng)語音識(shí)別系統(tǒng)具有超越現(xiàn)有技術(shù)水平的潛力。2010年6月,多倫多大學(xué)實(shí)習(xí)生George Dahl加入研究團(tuán)隊(duì),研究人員開始探討如何利用深層神經(jīng)網(wǎng)絡(luò)改善大詞匯量語音識(shí)別。

  George帶來了對(duì)深層神經(jīng)網(wǎng)絡(luò)工作原理的深刻見解,” 俞棟博士說:而且他在深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練方面有著豐富的經(jīng)驗(yàn),而深層神經(jīng)網(wǎng)絡(luò)正是我們所要?jiǎng)?chuàng)建系統(tǒng)的關(guān)鍵組成部分之一。”

  語音識(shí)別系統(tǒng)在本質(zhì)上就是對(duì)語音組成單元進(jìn)行建模。英語中表達(dá)發(fā)音方式的大約30個(gè)音素就是這樣的組成單元。最先進(jìn)的語音識(shí)別系統(tǒng)使用更短的稱為senone的單元,總數(shù)達(dá)到幾千或上萬個(gè)。

  之前的基于深層神經(jīng)網(wǎng)絡(luò)的語音識(shí)別系統(tǒng)就是對(duì)音素進(jìn)行建模。俞棟博士的研究實(shí)現(xiàn)了一次飛躍,當(dāng)他與語音組首席研究員鄧力博士和首席研究員兼研究經(jīng)理Alex Acero博士討論之后,提出使用深層神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)以千計(jì)的senones(一種比音素小很多的建模單元)直接建模。由此產(chǎn)生的論文《基于預(yù)訓(xùn)練的上下文相關(guān)深層神經(jīng)網(wǎng)絡(luò)的大詞匯語音識(shí)別》(Context-Dependent Pre-trained Deep Neural Networks for Large Vocabulary Speech Recognition)(由George Dahl、俞棟、鄧力和Alex Acero合著)描述了第一個(gè)成功應(yīng)用于大詞匯量語音識(shí)別系統(tǒng)的上下文相關(guān)的深層神經(jīng)網(wǎng)絡(luò)-隱馬爾可夫混合模型(CD-DNN-HMM)。

  也有人嘗試過上下文相關(guān)的人工神經(jīng)網(wǎng)絡(luò)模型,” 俞棟博士指出:但他們使用的架構(gòu)效果不佳。在我們發(fā)現(xiàn)所用的新方法使語音搜索的準(zhǔn)確率大大提高地那一刻,我們非常激動(dòng)。我們意識(shí)到,通過使用深層神經(jīng)網(wǎng)絡(luò)對(duì)senones直接建模,我們可以比最先進(jìn)的常規(guī)CD-GMM-HMM大詞匯量語音識(shí)別系統(tǒng)相對(duì)誤差率減少16%以上。考慮到語音識(shí)別作為一個(gè)活躍的研究領(lǐng)域已經(jīng)存在了50多年,這樣的進(jìn)展確實(shí)具有非常重要的意義。”

  為了加速實(shí)驗(yàn),研究小組還使用了通用圖形處理器來進(jìn)行語音模型訓(xùn)練和解碼。神經(jīng)網(wǎng)絡(luò)的計(jì)算在結(jié)構(gòu)上類似于電腦游戲中使用的3-D圖形,而現(xiàn)代的圖形卡可以同時(shí)處理近500個(gè)這樣的計(jì)算。在神經(jīng)網(wǎng)絡(luò)中運(yùn)用這種計(jì)算能力大大提升了建模可行性。

  2010年10月,俞棟博士在微軟亞洲研究院的一次內(nèi)部研討中介紹了這篇論文,他提到在此基礎(chǔ)上開發(fā)性能更強(qiáng)的大詞匯量語音識(shí)別聲學(xué)模型面臨以下挑戰(zhàn):實(shí)現(xiàn)并行訓(xùn)練和使訓(xùn)練擴(kuò)展到更大的訓(xùn)練集。Seide被這項(xiàng)研究深深觸動(dòng),他隨即加入該項(xiàng)目,并為團(tuán)隊(duì)帶來了大詞匯量語音識(shí)別、系統(tǒng)開發(fā)和基準(zhǔn)測(cè)試等方面的經(jīng)驗(yàn)。

  神經(jīng)網(wǎng)絡(luò)基準(zhǔn)測(cè)試

  我們通常認(rèn)為數(shù)百上千的senones數(shù)量太大而無法用神經(jīng)網(wǎng)絡(luò)準(zhǔn)確地建模和訓(xùn)練,”Seide說:然而,俞棟和他的同事們證明,這樣做不僅是可行的,而且還能顯著提高準(zhǔn)確率。現(xiàn)在,我們要證明的是這套CD-DNN-HMM模型可以有效使用更多的訓(xùn)練數(shù)據(jù)。”


  在新項(xiàng)目中,CD-DNN-HMM模型被用于語音-文本轉(zhuǎn)換,并在研究界公認(rèn)的極具挑戰(zhàn)性的電話語音識(shí)別標(biāo)準(zhǔn)數(shù)據(jù)集Switchboard上進(jìn)行評(píng)測(cè)。

  首先,研究團(tuán)隊(duì)對(duì)深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練工具進(jìn)行了改寫,以支持更大的訓(xùn)練數(shù)據(jù)集。然后,在微軟亞洲研究院軟件開發(fā)工程師李剛的幫助下,他們將新的模型和工具在含有300小時(shí)語音訓(xùn)練數(shù)據(jù)的Switchboard標(biāo)準(zhǔn)數(shù)據(jù)集上進(jìn)行評(píng)測(cè)。為了支持如此大量的數(shù)據(jù),研究人員建立了一些巨大的神經(jīng)網(wǎng)絡(luò)模型,其中一個(gè)包含了6,600多萬神經(jīng)間連結(jié),這是語音識(shí)別研究史上最大的同類模型。

  隨后的基準(zhǔn)測(cè)試取得了令人驚訝的低字詞錯(cuò)誤率——18.5%,與最先進(jìn)的常規(guī)系統(tǒng)相比,相對(duì)錯(cuò)誤率減少了33%。

  我們開始運(yùn)行Switchboard基準(zhǔn)測(cè)試時(shí),”回憶說:我們只期望實(shí)現(xiàn)類似語音搜索任務(wù)中所觀察到的結(jié)果,也就是16-20%的相對(duì)改善。整個(gè)訓(xùn)練過程大約花費(fèi)了20天的計(jì)算時(shí)間,而且每隔幾個(gè)小時(shí)就產(chǎn)生一個(gè)稍稍改良的新模型。每隔幾個(gè)小時(shí),我都會(huì)迫不及待地測(cè)試最新模型。你無法想象,當(dāng)相對(duì)改善超出預(yù)期的20%時(shí),我們有多興奮,而且模型仍在不斷改善,最后定格在30%以上。過去,只有極少數(shù)的單項(xiàng)技術(shù)能在語音識(shí)別方面實(shí)現(xiàn)如此幅度的改善。”

  由此產(chǎn)生的論文題為《使用上下文相關(guān)深層神經(jīng)網(wǎng)絡(luò)進(jìn)行交談?wù)Z音轉(zhuǎn)寫》(Conversational Speech Transcription Using Context-Dependent Deep Neural Networks)(由Frank Seide、李剛和俞棟合著),已經(jīng)于8月29日發(fā)表。這項(xiàng)工作已經(jīng)引起了科研界的高度重視,而研究團(tuán)隊(duì)希望通過在會(huì)議上發(fā)表這篇論文進(jìn)一步啟迪這條新的研究路徑,并最終將基于深層神經(jīng)網(wǎng)絡(luò)的大詞匯量語音識(shí)別推到一個(gè)新的高度。

  離未來更近了一步

  這種基于人工神經(jīng)網(wǎng)絡(luò)的非特定人語音識(shí)別新方法所實(shí)現(xiàn)的識(shí)別準(zhǔn)確率比常規(guī)系統(tǒng)高出了三分之一以上,俞棟、Seide和他們的團(tuán)隊(duì)向著流暢的語音-語音交互”這一目標(biāo)又邁進(jìn)了一大步。這項(xiàng)創(chuàng)新簡(jiǎn)化了大詞匯量語音識(shí)別中的語音處理,能實(shí)時(shí)識(shí)別并取得較高的準(zhǔn)確率。

  這項(xiàng)工作仍處于研究階段,還會(huì)面臨很多挑戰(zhàn),其中最嚴(yán)峻的挑戰(zhàn)在于擴(kuò)展到使用數(shù)萬小時(shí)訓(xùn)練數(shù)據(jù)。我們的研究成果只是一個(gè)開始,這一領(lǐng)域?qū)磉€會(huì)有更多令人振奮的進(jìn)展。”Seide說:我們的目標(biāo)是實(shí)現(xiàn)以前沒法實(shí)現(xiàn)的新的基于語音的流暢服務(wù)。我們相信,這項(xiàng)研究最終將改變我們的工作和生活。想象一下吧:用語音-語音實(shí)時(shí)翻譯進(jìn)行自然流暢的交談,用語音進(jìn)行檢索,或者用交談式自然語言進(jìn)行人機(jī)互動(dòng)。”

微軟亞洲研究院博客


標(biāo)簽:常州 南充 臨沂 遼寧 西藏 河源 佳木斯 梅州

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《微軟:語音識(shí)別技術(shù)突飛猛進(jìn)》,本文關(guān)鍵詞  微軟,語音,識(shí)別,技術(shù),突飛猛進(jìn),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《微軟:語音識(shí)別技術(shù)突飛猛進(jìn)》相關(guān)的同類信息!
  • 本頁收集關(guān)于微軟:語音識(shí)別技術(shù)突飛猛進(jìn)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    黄视频网站在线免费观看| 亚洲 激情| 国产欧美精品午夜在线播放| 精品国产三级a| 亚洲女初尝黑人巨高清在线观看| 国产伦精品一区二区三区无广告| 尤物视频网站在线观看| 日本免费乱人伦在线观看| 欧美1区| 国产a视频| 国产激情视频在线观看| 成人高清免费| 欧美18性精品| 欧美另类videosbestsex视频| 韩国三级香港三级日本三级| 99色视频| 国产国产人免费视频成69堂| 九九干| 九九久久99| 青青久热| 国产高清视频免费观看| 国产精品1024永久免费视频| 九九久久99| 日韩字幕在线| 欧美日本免费| 国产不卡在线看| 日本免费乱理伦片在线观看2018| 免费国产在线观看| 麻豆系列 在线视频| 亚洲 激情| 精品久久久久久中文| 欧美日本国产| 一级片免费在线观看视频| 欧美一区二区三区在线观看| 999久久66久6只有精品| 国产成人欧美一区二区三区的| 免费一级生活片| 色综合久久天天综线观看| 日本特黄一级| 亚洲女人国产香蕉久久精品| 免费国产在线观看| 99色视频| 精品久久久久久综合网| 欧美a级片免费看| 可以免费看毛片的网站| 九九九国产| 日韩中文字幕在线播放| 韩国三级香港三级日本三级| 日本免费乱理伦片在线观看2018| 久久精品欧美一区二区| 九九九网站| 亚洲第一页色| 欧美一级视| 黄色免费三级| 久草免费在线观看| 精品国产一区二区三区国产馆| 国产极品精频在线观看| 九九精品久久久久久久久| 成人免费观看视频| 免费一级生活片| 国产视频一区二区三区四区| 韩国三级香港三级日本三级| 日韩专区一区| 精品视频免费看| 国产伦理精品| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 成人a大片在线观看| 日韩av片免费播放| 国产伦久视频免费观看 视频| 欧美激情影院| 黄视频网站在线看| 午夜激情视频在线观看| 国产美女在线一区二区三区| 国产极品白嫩美女在线观看看| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 亚洲精品久久玖玖玖玖| 国产激情一区二区三区| 欧美a级片免费看| 精品视频在线观看视频免费视频 | 久久国产精品自由自在| 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 成人免费高清视频| 成人免费观看网欧美片| 色综合久久天天综线观看| 九九久久国产精品| 九九干| 黄视频网站在线看| 精品国产一级毛片| 高清一级做a爱过程不卡视频| 亚欧成人乱码一区二区| 欧美另类videosbestsex久久 | 国产精品12| 97视频免费在线观看| 国产伦久视频免费观看视频| 免费国产在线观看不卡| 国产伦精品一区二区三区无广告| 日本免费乱理伦片在线观看2018| 亚洲 国产精品 日韩| 精品久久久久久综合网| 精品视频一区二区三区| 91麻豆tv| 成人免费网站视频ww| 九九精品在线| 精品视频免费看| 亚洲精品影院久久久久久| 日韩中文字幕一区二区不卡| 91麻豆精品国产自产在线 | 久久99中文字幕| 韩国三级视频网站| 成人在激情在线视频| 韩国毛片免费| 国产麻豆精品视频| 国产欧美精品午夜在线播放| 亚洲精品影院久久久久久| 中文字幕一区二区三区精彩视频| 亚欧乱色一区二区三区| 国产一区二区精品久久| 国产一区二区精品在线观看| 国产不卡精品一区二区三区| 亚洲爆爽| 久久国产一区二区| 四虎影视久久久免费| 日韩在线观看免费完整版视频| 美女被草网站| 欧美另类videosbestsex| 一级女性大黄生活片免费| 成人免费网站视频ww| 二级片在线观看| 欧美a级片视频| 亚洲精品中文一区不卡| 麻豆系列 在线视频| 欧美电影免费| 国产伦精品一区二区三区无广告 | 好男人天堂网 久久精品国产这里是免费 国产精品成人一区二区 男人天堂网2021 男人的天堂在线观看 丁香六月综合激情 | 999久久狠狠免费精品| 成人免费高清视频| 青青久久国产成人免费网站| 精品视频免费看| 成人免费网站久久久| 一级毛片视频播放| 久久99中文字幕久久| 人人干人人插| 欧美激情在线精品video| 国产a一级| 日本伦理黄色大片在线观看网站| 亚飞与亚基在线观看| 欧美一级视频高清片| 韩国毛片免费| 色综合久久天天综线观看| 天天色成人| 国产91素人搭讪系列天堂| 国产极品精频在线观看| 国产a毛片| 日韩欧美一二三区| 午夜精品国产自在现线拍| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 精品视频在线观看免费| 日韩一级黄色大片| 色综合久久天天综合绕观看| 韩国三级香港三级日本三级| 日本在线播放一区| 欧美18性精品| 一本伊大人香蕉高清在线观看| 日韩免费在线视频| 国产原创中文字幕| 国产麻豆精品| 成人影视在线播放| 久久久久久久免费视频| 亚洲第一色在线| 国产视频一区在线| 欧美夜夜骑 青草视频在线观看完整版 久久精品99无色码中文字幕 欧美日韩一区二区在线观看视频 欧美中文字幕在线视频 www.99精品 香蕉视频久久 | 可以免费在线看黄的网站| 一本高清在线| 欧美18性精品| 二级特黄绝大片免费视频大片| 国产伦精品一区二区三区在线观看 | 国产视频一区在线| 欧美日本国产| 一级毛片视频在线观看| 久久99青青久久99久久| 在线观看导航| 色综合久久手机在线| 国产成人欧美一区二区三区的| 亚久久伊人精品青青草原2020| 精品久久久久久综合网| 国产亚洲精品成人a在线| 超级乱淫伦动漫| 可以免费看毛片的网站| 色综合久久久久综合体桃花网| 欧美激情影院| 国产成人欧美一区二区三区的| 久久国产精品只做精品| 久久久久久久男人的天堂| 一 级 黄 中国色 片| 天天色成人| 国产a毛片| 青青久久精品| 免费毛片播放| 欧美激情在线精品video| 欧美电影免费看大全|