阿里通義千問開源 Qwen2-Audio 7B 語音交互大模型：自由互動，無需輸入文本

2024/8/13 12:07:20 來源：IT之家作者：沛霖（實習） 責編：沛霖

評論：

感謝IT之家網(wǎng)友我搶了臺、風見暉一的線索投遞！

IT之家 8 月 13 日消息，阿里通義千問開源 Qwen2-Audio 系列的兩個模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。

作為一個大規(guī)模音頻語言模型，Qwen2-Audio 能夠接受各種音頻信號輸入，并根據(jù)語音指令執(zhí)行音頻分析或直接響應文本，有兩種不同的音頻交互模式：

官方在一系列基準數(shù)據(jù)集上進行了測試，Qwen2-Audio 超越了先前的最佳模型。

阿里通義千問開源 Qwen2-Audio 7B 語音交互大模型：自由互動，無需輸入文本

▲ Qwen2-Audio 整體表現(xiàn)

IT之家附相關鏈接如下：

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

相關文章