設置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

阿里通義千問開源 Qwen2-Audio 7B 語音交互大模型:自由互動,無需輸入文本

2024/8/13 12:07:20 來源:IT之家 作者:沛霖(實習) 責編:沛霖
感謝IT之家網(wǎng)友 我搶了臺、風見暉一 的線索投遞!

IT之家 8 月 13 日消息,阿里通義千問開源 Qwen2-Audio 系列的兩個模型 Qwen2-Audio-7B 和 Qwen2-Audio-7B-Instruct。

作為一個大規(guī)模音頻語言模型,Qwen2-Audio 能夠接受各種音頻信號輸入,并根據(jù)語音指令執(zhí)行音頻分析或直接響應文本,有兩種不同的音頻交互模式:

  • 語音聊天:用戶可以自由地與 Qwen2-Audio 進行語音互動,而無需文本輸入

  • 音頻分析:用戶可以在互動過程中提供音頻和文本指令對音頻進行分析

官方在一系列基準數(shù)據(jù)集上進行了測試,Qwen2-Audio 超越了先前的最佳模型。

▲ Qwen2-Audio 整體表現(xiàn)

IT之家附相關鏈接如下:

廣告聲明:文內(nèi)含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。

相關文章

關鍵詞:阿里通義千問,開源,大模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應用 魔方 最會買 要知