IT之家 10 月 27 日消息,據(jù) The Information 報(bào)道,谷歌計(jì)劃在 12 月預(yù)覽其大型動(dòng)作模型“Project Jarvis”。知情人士透露,該項(xiàng)目將幫助用戶執(zhí)行諸如“收集研究、購買產(chǎn)品或預(yù)訂航班”等任務(wù)。
報(bào)道稱,“Jarvis”將由未來版本的谷歌 Gemini 驅(qū)動(dòng),專門針對(duì) Chrome 瀏覽器進(jìn)行優(yōu)化。該工具旨在通過截取屏幕截圖、解析內(nèi)容并自動(dòng)點(diǎn)擊按鈕或輸入文本,幫助用戶“自動(dòng)化日常的網(wǎng)頁任務(wù)”。目前,該工具在執(zhí)行不同操作的時(shí)候,中間會(huì)有幾秒鐘的間隔時(shí)間。
IT之家注意到,目前所有大型 AI 公司都在研發(fā)類似功能的模型。微軟的 Copilot Vision 可以與用戶討論正在瀏覽的網(wǎng)頁;蘋果的 Apple Intelligence 預(yù)計(jì)將在明年具備跨多個(gè)應(yīng)用程序的屏幕識(shí)別能力;Anthropic 剛剛推出的 Claude 測試版已能在計(jì)算機(jī)上執(zhí)行操作;OpenAI 也在研發(fā)類似的功能。
報(bào)道稱,谷歌展示“Jarvis”的計(jì)劃也可能會(huì)有所變動(dòng),預(yù)計(jì)將首先向少量測試者發(fā)布,以幫助公司修復(fù)潛在的 Bug。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。