12 月 12 日消息,美國時(shí)間周三,谷歌發(fā)布了一款可以自主瀏覽網(wǎng)站的智能體(A.I. agent)。這種實(shí)驗(yàn)性工具能夠?yàn)g覽電子表格、購物網(wǎng)站以及其他在線服務(wù),然后代表用戶執(zhí)行操作。
目前,聊天機(jī)器人可以回答問題、寫詩或生成圖像。未來,它們還可能獨(dú)立完成在線購物等任務(wù),并操作電子表格等工具。
谷歌此次推出的智能體原型名為 Mariner。多家科技公司正在開發(fā)類似的智能體,包括 OpenAI 和 Anthropic 等初創(chuàng)企業(yè),它們也已發(fā)布了能自主使用軟件、網(wǎng)站以及其他在線工具的類似原型。
谷歌最新發(fā)布的 Mariner 基于當(dāng)天同步亮相的 Gemini 2.0 人工智能模型。Gemini 是谷歌眾多人工智能產(chǎn)品及研究項(xiàng)目的核心技術(shù)。同名聊天機(jī)器人和能夠直接回答用戶問題的人工智能搜索工具 AI Overviews 均采用了 Gemini 的不同版本。
“用戶只需在瀏覽器中輸入請求,Mariner 即可代表他們采取相應(yīng)行動,”谷歌項(xiàng)目經(jīng)理賈克林?康澤爾曼(Jaclyn Konzelmann)在接受采訪時(shí)說道。
Gemini 是一種被稱為神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)系統(tǒng),通過分析海量數(shù)據(jù)來學(xué)習(xí)新技能。例如,通過識別從互聯(lián)網(wǎng)收集的文章和書籍中的模式,神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)自動文本生成。
最新版 Gemini 能夠從多種數(shù)據(jù)類型中學(xué)習(xí),包括文本、圖像和聲音。這其中可能包含展示人們?nèi)绾问褂秒娮颖砀?、購物網(wǎng)站及其他在線服務(wù)的圖片?;?Gemini 所學(xué)到的知識,Mariner 能夠代替用戶操作這些服務(wù)。
“它知道需要按下哪個按鈕才能完成操作,”谷歌核心人工智能實(shí)驗(yàn)室負(fù)責(zé)人德米斯?哈薩比斯(Demis Hassabis)在采訪中說道?!八軌蛟诂F(xiàn)實(shí)中執(zhí)行任務(wù)?!?/p>
康澤爾曼補(bǔ)充道,Mariner 設(shè)計(jì)初衷是與用戶協(xié)作完成任務(wù)。例如,當(dāng)用戶在瀏覽器中瀏覽商品時(shí),Mariner 可以將物品加入購物車,但購買操作需由用戶親自完成。
谷歌首席執(zhí)行官桑達(dá)爾?皮查伊(Sundar Pichai)在一篇博客中表示,這些技術(shù)進(jìn)步“讓我們更接近實(shí)現(xiàn)通用助手的人工智能愿景”。
作為谷歌主流瀏覽器 Chrome 的擴(kuò)展功能,Mariner 成為公司人工智能戰(zhàn)略的重要組成部分。然而,這一計(jì)劃可能會遭遇障礙。因谷歌搜索引擎被裁定為非法壟斷,美國司法部已要求聯(lián)邦法院強(qiáng)制谷歌出售或拆分 Chrome 瀏覽器。
此外,這項(xiàng)技術(shù)本身也面臨挑戰(zhàn)??禎蔂柭姓J(rèn),Mariner 與其他聊天機(jī)器人一樣,會因其基于數(shù)據(jù)模式運(yùn)行而犯錯。雖然生成文本時(shí)的錯誤有時(shí)不易察覺,但當(dāng)系統(tǒng)嘗試使用網(wǎng)站或執(zhí)行操作時(shí),錯誤可能更加明顯。
“它目前能做到完全準(zhǔn)確嗎?還不能,”康澤爾曼坦言?!斑@仍然是一項(xiàng)實(shí)驗(yàn)性技術(shù)?!?/p>
目前,谷歌已向少量外部測試人員開放 Mariner,但尚未公布全面發(fā)布的計(jì)劃。
同日,谷歌還展示了新版 Project Astra,這款智能手機(jī)助手不僅能響應(yīng)用戶的圖像、文本輸入,還支持語音指令。與 OpenAI 今年早些時(shí)候推出的技術(shù)類似,Astra 在功能上超越了蘋果 Siri 等傳統(tǒng)數(shù)字助理。
新版 Project Astra 同樣尚未公開發(fā)布。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。