設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

谷歌版 ChatGPT 上手實(shí)測(cè)結(jié)果在此,體驗(yàn)申請(qǐng)通過(guò)飛快

量子位 2023/3/22 18:21:10 責(zé)編:夢(mèng)澤

原文標(biāo)題:《谷歌版 ChatGPT 突然公測(cè)!上手實(shí)測(cè)結(jié)果在此,體驗(yàn)申請(qǐng)通過(guò)飛快》

谷歌吃了大虧之后,這次一聲不吭,放了大招:

對(duì)標(biāo) ChatGPT 的 Bard 測(cè)試版,剛剛正式對(duì)外發(fā)布。

而且這次用戶在申請(qǐng)候補(bǔ)名單之后,無(wú)需經(jīng)歷漫長(zhǎng)的等待時(shí)間。

沒(méi)錯(cuò),量子位也已經(jīng)拿到了測(cè)試資格!(中間只有不到 5 小時(shí)的間隔。)

實(shí)測(cè)之后表示,Bard 效果驚人,情緒和事實(shí)性有,尤其是 ChatGPT 欠缺的數(shù)理能力,Bard 都不在話下。

甚至有時(shí)候還略勝當(dāng)前 GPT-4 一籌!

谷歌 CEO 皮猜哥(Sundar Pichai)解釋了如此上線之快的原因:希望獲得用戶的反饋,加速讓 Bard 變得更好。

話不多說(shuō),我們現(xiàn)在就來(lái)開(kāi)始體驗(yàn)。

Bard VS GPT-4

首先在聊天界面上,Bard 率先開(kāi)始介紹自己:

我是 Bard,您的創(chuàng)意和協(xié)作者。我有局限性,不會(huì)總是做對(duì),但你的反饋將幫助我改進(jìn)。

不確定從哪里開(kāi)始?你可以試試這些問(wèn)題:「為什么大模型有時(shí)候會(huì)犯錯(cuò)?」、「閃電是否會(huì)在同一個(gè)地方擊中兩次?」、「寫(xiě)一篇關(guān)于無(wú)酒精夏日特飲的博文」。

(嚴(yán)謹(jǐn)而又體貼)

而在人類(lèi)這邊的發(fā)送端,可以選擇鍵入語(yǔ)音輸入兩種方式。

首先最簡(jiǎn)單的難度,以它推薦的常識(shí)題閃電是否會(huì)在同一個(gè)地方擊中兩次?為例,來(lái)看看實(shí)際功能體驗(yàn)如何?

(不錯(cuò)不錯(cuò),秒秒鐘響應(yīng)。目前暫不支持中文,但可以借助谷歌翻譯插件)

從答案結(jié)構(gòu)上看,采用的是總分總結(jié)構(gòu)。

先總結(jié)發(fā)言:閃電可以襲擊同一個(gè)地方兩次。

隨后開(kāi)始細(xì)致地講原理「閃電被高大、尖銳的物體所吸引」、擺事實(shí)「帝國(guó)大廈每年都被閃電擊中 25 次」。

最后再給人類(lèi)提出切實(shí)的建議:

如果你遇到雷雨天氣,保持安全的最好辦法是避開(kāi)高大尖銳的物體,留在室內(nèi)。如果你在外面,蹲下來(lái),讓自己盡可能的小。

這波邏輯和真實(shí)性滿分!但因?yàn)槭枪雀柰扑]的問(wèn)題,暫且保持觀望。

而從功能上看,確實(shí)是十分完備的。

回答框的右上角「View other drafts」,有更多的版本可供選擇;而在左下角,你可以點(diǎn)贊 or 拉踩 or 重新生成,實(shí)在不行,還可以谷歌一下。

右下方還有一個(gè) more 的功能,你可以進(jìn)行復(fù)制和(反手一個(gè))舉報(bào)操作。

既然如此,開(kāi)始難度升級(jí)。作為參考,我們同題挑戰(zhàn) GPT-4。

1、經(jīng)典的哲學(xué)題:為什么人不能兩次踏入同一條河流?(借助閃電的靈感)

(很快啊,這次也是幾秒鐘響應(yīng))

從答案結(jié)構(gòu)上看,確實(shí)理解和邏輯能力滿分:首先解釋這句話本身含義,還提到了來(lái)自赫拉克利特的名言,以及更多解釋和本身意義。

而 GPT-4 這邊,幾乎是不加思考地給出了答案。

從結(jié)構(gòu)上看,主要分成兩個(gè)部分。首先提到這是赫拉克利特說(shuō)的,以及他的觀點(diǎn);然后解釋背后隱藏的生活意義。

2、小學(xué)加減法:356+132 等于多少?

結(jié)果 Bard 在 4 秒內(nèi)就給出答案,488 沒(méi)問(wèn)題的,這不比 ChatGPT 早期厲害多了!

那直接再上點(diǎn)難度,兩個(gè)數(shù)直接相乘:356*132 等于多少?

結(jié)果沒(méi)想到 Bard 依舊是秒秒鐘就給答案,而且完全正確!

再來(lái)看看 GPT-4 這邊,加法還行,但沒(méi)想到在乘法這邊,直接敗下陣來(lái)!

不過(guò)提醒它錯(cuò)了之后,它就又回答正確了。

如果換稍微難一點(diǎn)的高數(shù)題呢?比如:f (x)=x (x-1)(x-2)(x-3),f’(0)=?

正確答案應(yīng)該是 (-3)!,也就是-6。

但 Bard 這回就不太行了,并沒(méi)有理解題目的意思。

至于 GPT-4,思路倒是沒(méi)啥問(wèn)題,但最后計(jì)算又拉胯了……

不過(guò)同樣,只要你告訴它算得有問(wèn)題,GPT-4 就能馬上糾正。

3、理解笑話能力,Bard 還能聽(tīng)得懂英文里面的諧音梗。

而這也并沒(méi)有難倒 GPT-4。不過(guò)相較而言,Bard 似乎更有情緒一點(diǎn),它很開(kāi)心地回答出了答案;而 GPT-4 則更顯理智(無(wú)聊)。

不過(guò),在此之前,GPT-4 就已經(jīng)測(cè)試過(guò)是懂一些諧音梗的,甚至連中文的諧音梗也不在話下。

4、代碼能力:寫(xiě)一段斐波那契數(shù)列的代碼。

Bard 很快生成了正確的代碼,并且代碼習(xí)慣不錯(cuò)。

GPT-4 則更積極主動(dòng)一些,除了遞歸法,還給了迭代法的方案。

最后的最后,再考驗(yàn)一下它了解事實(shí)性的能力。(狗頭)

你知道量子位嗎?

回答錯(cuò)咯~Bard。

咳咳,正經(jīng)一點(diǎn)的:你知道 GPT-4 嗎?你想對(duì)它說(shuō)些什么?

可以看到,Bard 具備多輪對(duì)話的能力?!肝艺J(rèn)為它有潛力成為溝通和創(chuàng)造力的強(qiáng)大工具」,嗯~ 格局有了。

那競(jìng)爭(zhēng)對(duì)手呢?(我在搞事)

不過(guò)到這里,就有點(diǎn)問(wèn)題了。

另外比較遺憾的是,Bard 目前并不支持中文。

關(guān)于 Bard

谷歌 Bard 背后是由一個(gè)大語(yǔ)言模型(LLM)來(lái)支持,具體而言,就是輕量?jī)?yōu)化版的 LaMDA。

我們可以把 LLM 視作一個(gè)預(yù)測(cè)引擎,當(dāng)給出提示時(shí),它會(huì)從接下來(lái)可能出現(xiàn)的單詞中,一次選擇一個(gè)單詞來(lái)生成響應(yīng)。

谷歌在研究中發(fā)現(xiàn),對(duì)于 LLM 來(lái)說(shuō),使用的人越多,它的預(yù)測(cè)效果就會(huì)更好,這或許也就是為什么 Bard 如此著急公開(kāi)測(cè)試的原因了。

不過(guò)谷歌也直言不諱地說(shuō),雖然 LLM 很強(qiáng),但它并非是沒(méi)有缺點(diǎn)。

由于 Bard 會(huì)根據(jù)眾多信息來(lái)學(xué)習(xí),不過(guò)這些信息中必然存在著有偏見(jiàn)甚至錯(cuò)誤的那種。

因此,在回答用戶問(wèn)題時(shí),Bard 有時(shí)就會(huì)出現(xiàn)不準(zhǔn)確、誤導(dǎo)性的或虛假的信息。

例如在下面的案例中,Bard 就搞錯(cuò)了一個(gè)植物的學(xué)名:

除此之外,谷歌還強(qiáng)調(diào)說(shuō),Bard 并非是搜索引擎,而是它的一個(gè)補(bǔ)充。

最后,奉上申請(qǐng)候補(bǔ)名單的地址,感興趣的小伙伴可以抓緊嘗鮮了:

https://bard.google.com/

本文來(lái)自微信公眾號(hào):量子位 (ID:QbitAI),作者:楊凈 金磊

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:谷歌,ChatGPTBard

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知