百度推出的這個(gè)音頻轉(zhuǎn)文本應(yīng)用 據(jù)說(shuō)比人工速記快1.67倍
百度推出的這個(gè)音頻轉(zhuǎn)文本應(yīng)用 據(jù)說(shuō)比人工速記快1.67倍
百度人工智能中的語(yǔ)音識(shí)別技術(shù)正在變革速記行業(yè)。
近日,百度宣布推出一款能將音頻轉(zhuǎn)化為文字的SwiftScribe網(wǎng)頁(yè)應(yīng)用,將改變完全依賴人工的速記行業(yè)現(xiàn)狀。該網(wǎng)頁(yè)應(yīng)用背靠百度深度語(yǔ)音識(shí)別系統(tǒng),將音頻文件轉(zhuǎn)為文本,轉(zhuǎn)化效率較人工速記快1.67倍。
百度首席科學(xué)家吳恩達(dá)認(rèn)為,這一應(yīng)用將改變采訪和視頻字幕生成,他在社交網(wǎng)絡(luò)上評(píng)論稱:“該應(yīng)用非常適合將長(zhǎng)語(yǔ)音轉(zhuǎn)換為文本的人士,人工智能將實(shí)現(xiàn)1+1大于2的效果?!?/p>
具體應(yīng)用方面,用戶可在PC端打開SwiftScribe網(wǎng)頁(yè)應(yīng)用,選取wav和mp3格式的文件上傳,系統(tǒng)就能馬上進(jìn)行處理,時(shí)長(zhǎng)1分鐘的音頻文件可以在30秒內(nèi)轉(zhuǎn)換完成。用戶可使用鍵盤快捷鍵就能進(jìn)行加快播放、后退和添加換行符等操作,處理完成后,只需人工調(diào)整大小寫、標(biāo)點(diǎn)及部分拼寫細(xì)節(jié)即可快捷、準(zhǔn)確地完成音頻轉(zhuǎn)換。
百度推出的音頻文件轉(zhuǎn)文本應(yīng)用SwiftScribe。
從使用效果看,SwiftScribe可為速記員帶來(lái)1.67倍的效率提升,縮短40%的工作時(shí)間。目前該系統(tǒng)可處理1小時(shí)內(nèi)的音頻文件。
據(jù)悉,百度首先會(huì)邀請(qǐng)30-50名速記員對(duì)該應(yīng)用的測(cè)試版本進(jìn)行測(cè)試。
百度方面透露,該應(yīng)用未來(lái)會(huì)增加視頻文件的語(yǔ)音識(shí)別及自動(dòng)添加標(biāo)點(diǎn)符號(hào)等功能,并支持更多文件格式,降低用戶使用門檻。
此次推出的SwiftScribe網(wǎng)頁(yè)應(yīng)用,依托于百度新一代深度語(yǔ)音識(shí)別系統(tǒng)Deep Speech 2,該系統(tǒng)曾被《麻省理工科技評(píng)論》評(píng)為“2016年十大突破技術(shù)”之一。通過(guò)利用長(zhǎng)達(dá)數(shù)千小時(shí)的語(yǔ)音數(shù)據(jù)訓(xùn)練,Deep Speech 2可以不斷“學(xué)習(xí)”從語(yǔ)音中識(shí)別特定的字或詞。
2016年9月1日,在2016百度世界大會(huì)上,百度董事長(zhǎng)兼首席執(zhí)行官李彥宏表示,百度語(yǔ)音識(shí)別的準(zhǔn)確率能夠達(dá)到97%,已經(jīng)超過(guò)了人對(duì)語(yǔ)音的識(shí)別能力。
據(jù)了解,百度在2016年推出了應(yīng)用DeepSpeech2的安卓輸入法TalkType,讓用戶能夠用語(yǔ)音快速輸入文字。百度硅谷人工智能實(shí)驗(yàn)室項(xiàng)目領(lǐng)導(dǎo)人Bijit Halder在公告中稱:“TalkType是首款智能語(yǔ)音優(yōu)先輸入法?!?/p>
對(duì)話機(jī)器將成為2017人工智能的發(fā)展風(fēng)口,百度吳恩達(dá)曾在接受《華爾街日?qǐng)?bào)》采訪時(shí)表示,隨著準(zhǔn)確率的提高和用戶體驗(yàn)的提升,百度的語(yǔ)音產(chǎn)品已度過(guò)用戶心目中的“試用期”。在語(yǔ)音產(chǎn)品迅猛發(fā)展的大環(huán)境下,亞馬遜、蘋果、谷歌(微博)和微軟等科技巨頭都在加緊研發(fā)各自的語(yǔ)音識(shí)別技術(shù)。
國(guó)內(nèi)的智能語(yǔ)音及語(yǔ)言技術(shù)、人工智能技術(shù)研究公司科大訊飛,此前已經(jīng)推出了以語(yǔ)音轉(zhuǎn)文字為核心業(yè)務(wù)的轉(zhuǎn)寫服務(wù)平臺(tái)——訊飛聽見網(wǎng)站。據(jù)該網(wǎng)站介紹,科大訊飛的機(jī)器轉(zhuǎn)寫服務(wù)一小時(shí)音頻約5分鐘轉(zhuǎn)寫成稿。如果是音質(zhì)清晰、普通話標(biāo)準(zhǔn)的音頻,轉(zhuǎn)寫正確率可達(dá)90%以上。
目前,百度SwiftScribe音頻轉(zhuǎn)換服務(wù)免費(fèi)對(duì)外開放。據(jù)百度方面人士透露,未來(lái)希望將該應(yīng)用向商業(yè)化應(yīng)用轉(zhuǎn)變。
繼續(xù)閱讀與本文標(biāo)簽相同的文章