IT之家 12 月 14 日消息,階躍星辰昨日在公眾號宣布推出 Step-1o 千億參數(shù)端到端語音大模型,據(jù)稱是“國內首個千億參數(shù)端到端語音大模型”。
據(jù)階躍星辰介紹,傳統(tǒng)的語音模型采用級聯(lián)方案,用戶輸入的語音信息需要先轉化為文本,再二次轉化成語音輸出,這個過程不僅會降低傳輸效率、更會在過程中折損掉包括情緒在內的信息,導致語音模型時延長反應慢、回答質量和智能水平不足、情感表達空洞刻板的缺陷。但端到端的語音方案,可以實現(xiàn)語音理解和生成的一體化,提升模型智商和情商的上限。
IT之家從官方介紹獲悉,Step-1o 支持語音、文本等混合形式的輸入和輸出,可以快速反應并隨時打斷,它也能深度理解和模仿音色、韻律、方言、個性化的口語表達習慣等聲音特征;
Step-1o 能夠通過自學和模仿不斷提升回復質量,既能提供解決問題的專業(yè)建議,也能作為提供高情緒價值的陪伴。此外,Step-1o 還傳承了階躍星辰語言大模型的創(chuàng)作能力。
階躍星辰透露,近期,Step-1o 將接入躍問 App 端,為用戶提供實時語音通話服務。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。