設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

GPT-4 創(chuàng)造力全面碾壓人類,最新創(chuàng)造力測(cè)試 GPT4 排名前 1%

新智元 2023/6/25 16:53:06 責(zé)編:夢(mèng)澤

最新研究發(fā)現(xiàn),GPT-4 的創(chuàng)造力全方位持平或碾壓人類。

最近,一項(xiàng)有關(guān) GPT-4 的創(chuàng)造力思維測(cè)試火了。

來(lái)自蒙大拿大學(xué)和 UM Western 大學(xué)的研究團(tuán)隊(duì)發(fā)現(xiàn),GPT-4 在 Torrance 創(chuàng)造性思維測(cè)試(TTCT)中的得分直接排在了前 1%。

不管是流暢性、靈活性,還是原創(chuàng)性,要不和人類勢(shì)均力敵,要不直接碾壓人類。

這項(xiàng)研究在南俄勒岡大學(xué)的創(chuàng)意會(huì)議上發(fā)表(Conference on Creativity)。

包括蒙大拿大學(xué)和西澳大學(xué)教授在內(nèi)的一個(gè)研究小組發(fā)現(xiàn):

OpenAI 的 GPT-4 在托倫斯創(chuàng)造性思維測(cè)試(TTCT)中的得分在前 1%,在流暢性、靈活性和原創(chuàng)性等創(chuàng)造性能力方面與人類相匹配或超過(guò)了人類。

這些發(fā)現(xiàn)在南俄勒岡大學(xué)的創(chuàng)意會(huì)議上發(fā)表。

GPT-4「頭腦風(fēng)暴」

主導(dǎo)這項(xiàng)研究的 Guzik 博士表示,這項(xiàng)研究對(duì)初創(chuàng)企業(yè)的建立和小企業(yè)的發(fā)展會(huì)有巨大影響,它將成為推動(dòng)整體經(jīng)濟(jì)活動(dòng)增長(zhǎng)的重要力量。

Guzik 進(jìn)一步闡釋,GPT-4 所表現(xiàn)出的非凡創(chuàng)造力標(biāo)志著 AI 驅(qū)動(dòng)的頭腦風(fēng)暴和解決方案開發(fā)的全新階段。

換句話說(shuō),以往初創(chuàng)企業(yè)和小企業(yè)基本都面臨資源限制的典型問(wèn)題,這限制了他們雇傭大型團(tuán)隊(duì),對(duì)市場(chǎng)進(jìn)行全面研究的能力。

而這一切,將會(huì)被 AI 的創(chuàng)造力扭轉(zhuǎn)。

該研究團(tuán)隊(duì)的第一次會(huì)面,是在 2013 年 Boise 州立大學(xué)舉辦的創(chuàng)新和創(chuàng)造力研討會(huì)上。

當(dāng)時(shí),Gilde 博士和 Guzik 博士參加了由 Byrge 舉辦的主題研討會(huì)。三人發(fā)現(xiàn),他們都對(duì)和創(chuàng)造力有關(guān)的東西感興趣。

他們共同認(rèn)為,AI 技術(shù)會(huì)對(duì)商業(yè)教育和商業(yè)發(fā)展有重大輔助作用。隨著他們對(duì) AI 的探索不斷加深,更印證了他們的想法。

「尤其是 ChatGPT?!?/p>

對(duì)于他們與 GPT-4 的最新研究項(xiàng)目,研究人員對(duì)評(píng)估其與人類創(chuàng)造力相比的創(chuàng)造能力感興趣。

GPT-4 通過(guò) ChatGPT 使用 TTCT 的兩個(gè)變體進(jìn)行了八次測(cè)試,TTCT 是研究人員評(píng)估創(chuàng)造力的黃金標(biāo)準(zhǔn)。

使用 TTCT,研究人員要求 GPT-4 通過(guò)提問(wèn)、猜測(cè)原因、考慮潛在的后果、產(chǎn)生產(chǎn)品改進(jìn)的想法、設(shè)想現(xiàn)有產(chǎn)品的新的替代用途以及想象未來(lái)的情景來(lái)展示其創(chuàng)造能力。

TTCT 的第三方評(píng)估機(jī)構(gòu) Scholastic Testing Services 將人工智能的反應(yīng)與人類的反應(yīng)進(jìn)行了比較。

在所有八項(xiàng)測(cè)試中,GPT-4 在流暢性方面的得分都在所有人類反應(yīng)的前 1%,即對(duì)每項(xiàng)活動(dòng)展現(xiàn)出了大量反應(yīng)的能力。

在靈活性方面,即產(chǎn)生各種想法的能力,以及從一種方法轉(zhuǎn)向另一種方法的能力,有三項(xiàng)測(cè)試的得分在前 1%,兩項(xiàng)在前 2%,其余三項(xiàng)在前 7%。

而在 Guzik 博士眼中,評(píng)分里最重要的就是原創(chuàng)性了。

在所有八項(xiàng)測(cè)試中,GPT-4 在原創(chuàng)性方面的得分都在前 1%,即:產(chǎn)生不尋?;颡?dú)特的反應(yīng)的能力,也就是超出常規(guī)的能力。

Guzik 博士表示,「這是第一項(xiàng)能夠展現(xiàn) AI 可以產(chǎn)生與人類創(chuàng)造能力的現(xiàn)有門檻相匹配或超過(guò)的原創(chuàng)反應(yīng)的研究?!?/p>

研究小組預(yù)測(cè),在未來(lái)五年內(nèi),創(chuàng)業(yè)過(guò)程的每一個(gè)組成部分,以及一般的商業(yè),都將受到人工智能的影響。

這包括識(shí)別獨(dú)特的機(jī)會(huì)和重要的問(wèn)題,產(chǎn)生新穎的解決方案想法,改進(jìn)產(chǎn)品,產(chǎn)生新的營(yíng)銷策略,以及想象未來(lái)的場(chǎng)景和結(jié)果等等。

該團(tuán)隊(duì)的研究結(jié)果,包括進(jìn)一步研究訓(xùn)練 GPT-4 以提高其在商業(yè)創(chuàng)新和創(chuàng)業(yè)等特定領(lǐng)域的創(chuàng)造能力,計(jì)劃在今年夏天晚些時(shí)候發(fā)表。

創(chuàng)造力稀釋

其實(shí),這并不是第一個(gè)研究 GPT-4 創(chuàng)造力的研究項(xiàng)目。

國(guó)外小哥 Phil Bennett 曾表示,他擔(dān)心 AI 的創(chuàng)造力會(huì)讓人類陷入困境。

創(chuàng)造力是獨(dú)屬于人類的工具,是區(qū)分人類和其它生物的關(guān)鍵點(diǎn)。

而 AI 生成的東西嚴(yán)格來(lái)講并不是「創(chuàng)造」,而是類似一種「反芻」,將喂進(jìn)去的東西通過(guò)不同的方式結(jié)合在一起,然后進(jìn)行輸出。

而這也是 Bennett 所擔(dān)心的。他擔(dān)心類似 GPT-4、DALL-E 等工具會(huì)稀釋人類的創(chuàng)造力。

換句話說(shuō),不會(huì)再有真正新的東西被創(chuàng)造出來(lái),產(chǎn)生的東西都是把既有的東西拆分重組。

參考資料:

  • https://nbcmontana.com/news/local/um-um-western-researchers-find-openais-gpt-4-outperforms-humans-in-creativity-tests

本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:ChatGPT,人工智能

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知