設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

消息稱 OpenAI 將推出多模態(tài)人工智能數(shù)字助理:可語音對話、識別物體

2024/5/12 15:29:09 來源:IT之家 作者:遠洋 責(zé)編:遠洋

IT之家 5 月 12 日消息,據(jù) The Information 報道,OpenAI 最近向部分客戶展示了一款新型多模態(tài)人工智能模型,該模型能夠進行語音對話和物體識別。有消息人士透露,這或許就是 OpenAI 計劃在即將到來的 5 月 13 日正式發(fā)布的內(nèi)容之一。

圖源 Pexels

報道稱,相比于 OpenAI 現(xiàn)有的獨立圖像識別和文本轉(zhuǎn)語音模型,該新型模型能夠更快、更準確地處理圖像和音頻信息。例如,它可以幫助客服人員“更好地理解來電者的語氣語調(diào),判斷他們是否在使用諷刺語氣”。理論上,該模型還能輔助學(xué)生學(xué)習(xí)數(shù)學(xué)知識,或翻譯現(xiàn)實世界中的標志文字。

不過,消息人士也指出,雖然該模型在某些問題解答方面能夠超越 GPT-4 Turbo,但仍有可能出現(xiàn)自信地給出錯誤答案的情況。

IT之家注意到,開發(fā)者 Ananay Arora 發(fā)布了一張包含通話相關(guān)代碼的截圖,暗示 OpenAI 可能正在為 ChatGPT 加入打電話的功能。Arora 還發(fā)現(xiàn)了一些證據(jù)表明 OpenAI 正在配置用于實時音視頻通信的服務(wù)器。

OpenAI 首席執(zhí)行官薩姆?阿爾特曼 (Sam Altman) 已經(jīng)明確否認即將發(fā)布的新品是代號為 GPT-5 的大型語言模型(據(jù)稱其性能將大幅優(yōu)于 GPT-4)。The Information 則表示,GPT-5 可能將在今年年底前正式亮相。阿爾特曼還表示,OpenAI 不會發(fā)布新的人工智能搜索引擎。

如果 The Information 的報道屬實,OpenAI 的新品發(fā)布仍可能會對即將舉行的 Google I / O 開發(fā)者大會產(chǎn)生一定影響。眾所周知,谷歌也在測試利用人工智能進行電話呼叫的技術(shù)。此外,谷歌還有一個據(jù)傳即將發(fā)布的項目,代號為“Pixie”。Pixie 是一款能夠通過設(shè)備攝像頭識別物體的多模態(tài) Google Assistant 替代品,可以為用戶提供諸如“如何前往購買地點”或“如何使用”等信息。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:OpenAI人工智能

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知