在百度 AI 全面賦能羅技的合作啟動儀式上,百度集團(tuán)副總裁吳甜公布了百度目前最新的語音輸入服務(wù)能力。
據(jù)介紹,目前百度語音服務(wù)日均調(diào)用量已經(jīng)達(dá)到 155 億次,輸入法日均用戶突破 6 億。在技術(shù)性能上,百度語音識別技術(shù)的準(zhǔn)確率已經(jīng)達(dá)到 98.4% 以上,同時支持 203 國語言互譯,在多國語音輸入及翻譯,中英文自由說以及離在線語音方面,均取得了相應(yīng)的突破。
在會后與記者交流的過程中,百度語音首席架構(gòu)師賈磊透露了一項目前百度正內(nèi)部研發(fā),但并未正式公開公布的技術(shù)項目。據(jù)介紹,該項目是一款被簡稱為 “BTR”的未公布技術(shù)項目,該項目能通過對使用者歷史糾錯數(shù)據(jù)的自主學(xué)習(xí),優(yōu)化提升使用者語音交互的算法模型,最終提升語音交互準(zhǔn)確度,滿足用戶的個性化語音交互需求。
在通常的人機(jī)交互語境中,由于噪音、方言以及說話人中英文混雜交談等多方面的原因,往往導(dǎo)致絕大多數(shù)市面上通用的語音交互設(shè)備識別準(zhǔn)確度低,自動糾錯能力不夠,使用體驗難有保障。
據(jù)賈磊介紹,基于 “BTR”這一技術(shù)項目實現(xiàn)的語音交互服務(wù),不僅能夠滿足使用者的個性化語音交互需求,同時還能有效地縮減產(chǎn)品的后端訓(xùn)練數(shù)據(jù)量,進(jìn)一步幫助使用者降低使用的資金成本。
目前,該技術(shù)已被運用到了此次發(fā)布會上百度聯(lián)合羅技推出的全新 M380 語音鼠標(biāo)上。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。