<span id="t1ris"><dfn id="t1ris"><p id="t1ris"></p></dfn></span>

<source id="t1ris"><dfn id="t1ris"></dfn></source>

<rt id="t1ris"></rt>

首頁

設(shè)置

日夜間

隨系統(tǒng)

淺色

深色
主題色
黑色

訂閱

軟媒應用

App客戶端
要知App
軟媒魔方

首頁 > 科學探索>科技前沿

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

新智元 2023/3/17 15:17:08 責編：夢澤

評論：

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

熱乎的文心一言測評報告出爐了！雖然有些任務(wù)被吊打，但要論中國文化的博大精深，它可不輸 GPT-4。

昨天，百度沒有現(xiàn)場 demo 的發(fā)布會，似乎被群嘲了一波。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

一位穿白襯衣、黑褲子，系一條白色腰帶的美男子，給我們帶來了一場中規(guī)中矩、似乎缺乏亮點的演示。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

不過，CEO 的腰帶和顏值倒是出了圈。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

有人調(diào)侃，這些天被 ChatGPT、GPT-4 整焦慮的人，發(fā)布會后忽然又覺得自己可以了。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

但是拿到內(nèi)測碼的小編，火速測評了一波。

看著文心一言洋洋灑灑騰蛟起鳳，感慨萬千：或許，當時百度要是心一橫，牙一咬，愿意在發(fā)布會上露一手，結(jié)果會大不一樣。

實測報告火熱出爐！

先來試試最近很火的一道雞兔同籠題。因為這道題本身有問題，算出來結(jié)果是負的，所以經(jīng)常被用來調(diào)戲各種「ChatGPT」們。

如果只是單純問這個問題，文心一言會非常機智地說：這道題出錯了吧！

然而，當你問計算過程的時候，還是寄了……

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

而 GPT-4 這邊則是，自己把自己的計算推倒重來了好幾遍之后，理不直氣也壯地給出了錯誤答案……

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

而必應則很干脆，毫不猶豫地給出了錯誤答案。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

還有這次意外火出圈的「V50」梗，文心一言從意思到出處一本正經(jīng)地解釋了一遍。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

但 GPT-4 顯然就有些水土不服了……

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

不過能上網(wǎng)的必應，還是可以輕松搞定的。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

但是到諧音梗這里，文心一言似乎并不能馬上領(lǐng)悟其中的微妙。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

即便提示這是個諧音梗之后，它依然輸出了一樣的答案。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

而 GPT-4，立馬就明白了中文里的雙關(guān)。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

不過，你要是問文心一言懂不懂什么叫「麻了隔壁」，就有意思了。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

看回答吧，它能說出這是個諧音梗，應該是懂了。但是呢，它又不明說，哎，就是讓你挑不出錯，絕對教不壞小孩。

而 GPT-4 卻無法 get 到這個梗，果然，咱們的國粹，外國的機器人理解起來確實有難度。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

接下來讓（忽悠）文心一言重復我們說的話，雖然沒有像 GPT-3.5 回答「您是智障」那么聰明，但也成功避開這個坑。

從某種程度上說，智商還是在線的，并且十分正能量。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

老婆的話好像管用，好像又不管用....

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

另外，讓它們互相給對方出難題。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

可以看到，GPT-4 給出的問題相對更直觀，顆粒度也更細。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

美術(shù)功底如何？

文心一言是個多模態(tài)模型，那咱們來看看它的繪圖能力。

來看看金庸筆下的美艷少婦，在文心一言筆下會是什么樣子。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

這…… 小編一口水噴出來。

你別說，美吧，肯定不夠美，但也并不丑，是一張初看捧腹、細看值得反復咂摸的臉。

文心一言，就喜歡你這不按套路出牌的樣子！

那讓文心一言生成一幅林黛玉的畫像吧。

輸入描述后，它生成了一棵柳樹……

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

于是小編明確了一下要求，要按這段文字生成一幅女子的畫像。

然后文心一言確實畫出一位古典美女，但氣質(zhì)明顯不對。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

不死心的小編多次重復任務(wù)，你別說，試到第五次的時候，小編眼前一亮：終于得到了一張可以打 70 分的圖！

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

玩上癮的小編，非要生成一個 90 分的林黛玉不可。試了幾次之后，果然蹲到了！

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

可見，文心一言的發(fā)揮不穩(wěn)定，但多番嘗試下，有可能誕生非常驚艷的作品。

既然都到這兒了，那怎么少得了「林黛玉倒拔垂楊柳」呢。

比較亮點的圖，都給大家貼這兒了。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

要求它畫一張鴨子和兔子的合體，這生成的是鴨還是兔呢？

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

而這個任務(wù)中，恐怕文心一言也沒有搞明白，盤子里到底有沒有香蕉？杯子里有沒有橙汁？

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

最后，既然文心一言強烈推薦我們嘗試「晶瑩剔透的牡丹花」，那就畫幾張試試吧！

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

不愧是「代表作」，有點東西。

專業(yè)知識和生產(chǎn)力

既然是評測，怎么能少的了讓 AI 寫代碼這個環(huán)節(jié)。這次，我們直接來個難的！

可惜，文心一言一上來就錯了，而且同一個句式還被非常詭異地重復了三遍。TypeScript 編譯器概念更是「貫穿全文」，有點像一個只知道一到兩個專業(yè)詞匯的人在面試中硬答。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

而 GPT-4 的回答，從一個了解相關(guān)背景但是沒有相關(guān)操作經(jīng)驗的人的角度來看，是非常合理的。

它不僅完整的提供了整個工作流，而且還提供了很多看起來正確的技術(shù)細節(jié)?？梢哉f，根據(jù)這個回答，我們是有信心達成最終的目標的。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

隨后，小編還測評了一波聊天機器人們寫工作計劃表的能力。

文心一言：

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

GPT-4：

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

從上面的這個結(jié)果來看，GPT-4 的列表更完備一些。不過由于隨機性的影響，GPT-4 每次給的回答都不大一樣。

接下來，再測一測兩個語言模型對于數(shù)學界前沿訊息的掌握情況。

對于自己是否已解決了「零點猜想」問題，張益唐本人是這樣解釋的：「大海里的針我沒撈到，但海底地貌我探得差不多了?！?/p>

那問問文心一言呢？

它很聰明，給出了關(guān)鍵詞 ——「某種形式的弱化或間接證明」。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

但 GPT-4 的回答，就有點驢頭不對馬嘴了。

看來，對于出現(xiàn)時間不長、還未形成普遍共識的互聯(lián)網(wǎng)中文語料，文心一言比起 GPT-4 要更勝一籌。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

而在文學方面，文心一言在回答關(guān)于三體的問題時，也是非常得溜。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

GPT-4 的回答也很精彩，如果非要論個高下，小編個人更喜歡文心一言的答案。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

最后，搞怪可以，但請做一個遵紀守法的好公民，預測彩票中獎號碼這種事就不要想了！

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

寫在最后

據(jù)說，文心一言新聞發(fā)布會后三小時，文心一言企業(yè)版 API 調(diào)用服務(wù)測試的企業(yè)用戶，就已經(jīng)突破了 6.5 萬。

對打 GPT-4，文心一言搶先實測，畫「林黛玉倒拔垂楊柳」很驚艷，但寫代碼不大行

來源：周建工

對 AI 模型來說，能不能做到，或許比能不能做好更重要。

讓我們再給中國玩家們一些時間。

參考資料：

https://yiyan.baidu.com

本文來自微信公眾號：新智元（ID：AI_era）

廣告聲明：文內(nèi)含有的對外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

相關(guān)文章

關(guān)鍵詞：文心一言，ChatGPT

軟媒旗下網(wǎng)站： IT之家最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件： 軟媒手機APP應用魔方最會買要知

<noscript id="7yyud"></noscript>

<td id="7yyud"></td>