設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

彈幕炸了:OpenAI 直播大秀語音指揮 AI 自動編程

量子位 2021/8/11 8:39:54 責(zé)編:遠(yuǎn)洋

剛剛,OpenAI 又玩出了一個新高度。

只輸入自然語句,AI 就自動做了個小游戲!

劃重點:不! 用! 你! 編! 程!

來,感受一下這個 feel。

第一步,“小人兒”搞里頭,輸入一句話就能讓它按照方向鍵左右移動:

Now make it controllable with the left and right arrow keys.

AI 在理解了需求之后,自動編程,然后小人兒就真的可以左右移動了。

第二步,“石頭”搞里頭,同樣輸入一句話,讓它“從天而降”:

Now have it fall from the sky, and wrap around.

第三步,用自然語言簡單再制定些規(guī)則,若小人兒被石頭砸中則終止游戲。

Constantly check if the person and the boulder overlap at all, and if so, you lose.

最后還讓 AI 生成結(jié)束提示,其中要包括一句鼓勵人的話。

AI 挑中的是“Try Again!”

當(dāng)然,還有規(guī)則更復(fù)雜的小游戲(例如增加計分等功能),也可以用同樣的方式,分分鐘生成:

這是魔法吧!現(xiàn)在開發(fā)小游戲都靠“打字”了?!

圍觀直播的觀眾們,也是發(fā)出了同樣的感慨,瞧瞧這滿屏止不住的彈幕:

有網(wǎng)友甚至直呼道:

編程,已經(jīng)變成 AI 自己的游戲了。

這就是 OpenAI 重磅發(fā)布的新品 ——Codex,一個能自己編程的 AI。

AI 編程這事并不新鮮了,像 GitHub 前不久鬧得風(fēng)風(fēng)火火的 Copilot,就是其中一個。

但它背后的技術(shù),其實還是來自于 OpenAI。

然而這一次,OpenAI 給自己的能力升了個級,來了個新版本。

不僅如此,搞一個小游戲,僅僅是 Codex 能力的冰山一角罷了。

一起感受一下它更多驚艷的表現(xiàn)吧。

不用打字,直接語音命令它!

給 AI 打字“提需求”,還是略顯麻煩了一些。

能不能直接說話下達(dá)命令呢?

這個還真可以有!

OpenAI 這次與微軟合作出了一個 Word 插件,便帶了這種語音控制的功能。

直接對著 AI 下命令“把每行開頭的空格去掉”,AI 通過微軟給的接口一頓操作,成功執(zhí)行:

啪的一下,全文就左對齊了有木有。

而且 AI 還精準(zhǔn)地理解了命令的含義,那些段與段之間的空行并沒有改動。

來再復(fù)雜一點的。

給 AI 下達(dá)“每數(shù)到五行就加粗”命令,也是能輕松 hold 得?。?/p>

這種把任務(wù)吩咐下去,就有“人”給你完成的感覺,是不是很像老員工指揮實習(xí)生?

總之呢,是比羅永浩前幾年發(fā)布的 TNT 系統(tǒng)語音辦公要強(qiáng)上那么“億”點點了。

除了官方的演示,這次內(nèi)測用戶 aniakubow,還讓 AI 表演了通過 152 字描述生成一個網(wǎng)頁。

可以看出這里 Codex 是用 Javascript 操作 Document 對象來生成網(wǎng)頁,可能是訓(xùn)練集里沒有直接的 HTML 代碼的緣故吧。

最后,除了現(xiàn)場演示外,OpenAI 還在 Arxiv 上發(fā)布了 Codex 的論文預(yù)印版。

論文中,Codex 要面對的挑戰(zhàn)甚至有刷 IOI 和 ACM 難度的競賽題!

Codex 用對每道題生成 1000 種答案這種暴力方法,能做出 600 多道競賽題測試集中的 3.23%,并且通過全部的測試用例。

這個編程題目測試集是 UC 伯克利研究人員在 5 月份剛剛做好的。

當(dāng)時測試的 GPT-2、GPT-3 和開源的 GPT-Neo 可是在競賽難度上全軍覆沒,一道都沒做出來。

沒想到短短兩個多月,專為代碼而生的 Codex 就為前輩們洗刷了恥辱。

Codex 的“魔法”,是如何實現(xiàn)的?

這么炫酷的能力,莫非還是像 GPT-3 一樣堆數(shù)據(jù),大力出奇跡嗎?

不全是,這次 Codex 最大的一個版本是 120 億參數(shù),比起 GPT-3 的 1750 億還是小了很多。

要了解具體情況,還要從它的開發(fā)歷程說起。

最早,OpenAI 研究人員拿 GPT-3 做各種試驗,發(fā)現(xiàn) GPT-3 能從 Python 注釋中生成一些簡單的代碼。

這可把他們高興壞了,因為 GPT-3 根本沒特意拿代碼訓(xùn)練過,只是看過一些博客和帖子中零星的代碼片段。

想想 GPT-3 在自然語言上的出色表現(xiàn),要是專門訓(xùn)練一個代碼版的 GPT-3,那肯定也能再次震驚業(yè)界。

于是,他們找到了 GitHub,這個擁有最多開源代碼的“小伙伴”來合作。

一開始是拿到了 179G 的 Python 代碼,但其中不乏存在一些篇幅太長的,以及明顯是自動生成的那種。

在剔除掉這些“不達(dá)標(biāo)”的代碼后,最后留下的代碼大小為 159G。

接下來當(dāng)然是做預(yù)訓(xùn)練,把這些代碼都喂給 AI (Codex)。

不過這里有一個問題:

GitHub 上的開源代碼難免會有 Bug,AI 學(xué)了一堆有問題的代碼可咋辦?

其實這倒也好說,預(yù)訓(xùn)練之后不是還要微調(diào)嘛。

微調(diào)的時候,全用編程競賽里的正確答案,以及 PyPI 里的靠譜開源代碼就可以了。

最后,120 億參數(shù)版的 Codex,能對 28.81% 的問題給出正確答案。

這個準(zhǔn)確率超過之前的開源代碼預(yù)訓(xùn)練模型 GPT-Neo 和 GPT-J,還有基于 GPT-2 的代碼補(bǔ)全工具 TabNine。

這個成績雖然不錯,不過離能實際應(yīng)用還是有點遠(yuǎn)了。

不過,這也難不住 OpenAI 的研究團(tuán)隊。

他們很快便想到了“突破口”:

人類編程的時候,不也經(jīng)常先出一個版本,然后反復(fù)修改 bug 嘛~

那就讓 AI 像人一樣反復(fù)修改,改出 100 個版本來,從中總能挑出幾個正確的來。

用上這種拿“量”堆出來的方法,Codex 的最終成績是:

77.5%!

強(qiáng),但不完全強(qiáng)

Codex 令人驚艷的表現(xiàn),一度讓網(wǎng)友們大呼:

要失業(yè)了要失業(yè)了!

有人直接在公屏上打出:再見了,計算機(jī)專業(yè)的學(xué)子們。

不過大家也不必如此擔(dān)心,因為在演示過程中,其實就出現(xiàn)了翻車的情況。

在輸入“Say Hello World with empathy”后,Codex 給出的結(jié)果居然還是“Hello World with empathy”。

這也側(cè)面說明了 Codex 現(xiàn)在還不是完美的。

OpenAI 就表示:

即便是參數(shù)達(dá)到 120 億的 Codex 12B,它的能力可能也還不如一位編程剛剛?cè)腴T的學(xué)生。

雖然 Codex 學(xué)習(xí)上億行代碼,但它更大程度是“記住了”這些代碼,并不是真正意義上的懂編程語言。

而且 Codex 對長字符串的理解也比較困難。

并且隨著字符數(shù)量的增加,Codex 的性能表現(xiàn)下降得非常明顯。

在這種情況下,Codex 就不能很好地理解用戶的意圖,結(jié)果可想而知,給出的代碼可能就是完全錯誤的了。

此外,在理解變量和運算較多的注釋時,Codex 也會犯錯:

在這個例子中,120 億參數(shù)版的 Codex,忘記了對變量 w 做減法,也沒有返回所有數(shù)字的乘積。

這些對于還在學(xué)習(xí)編程的新手程序員而言,非常不友好。

而且由于生成的代碼準(zhǔn)確性和正確性都還不能保證,因此在安全問題上也存在一定風(fēng)險。

不僅如此,OpenAI 還表示,Codex 會生成帶有種族歧視的內(nèi)容。

在社會層面上,OpenAI 還提出 Codex 的出現(xiàn)或許會沖擊程序員的就業(yè);如果被濫用,還有網(wǎng)絡(luò)犯罪方面的隱患。

最后還有一點,就是環(huán)境方面的問題。

畢竟它作為大模型,參數(shù)量的規(guī)模不容小覷。

要不是合作方微軟 Azure 云買了足夠多的碳排放限度,Codex 可能還不能和我們見面呢(手動狗頭)。

如果想要試玩的話,OpenAI 還準(zhǔn)備了一個 Python 編程大賽,在這場比賽中 Codex 會作為你的搭檔和你一同解題。

比賽將于北京時間 8 月 13 日凌晨一點開始,就是這時間對國內(nèi)不太友好。

大賽報名地址:

https://openai.com/blog/openai-codex/

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:編程,OpenAI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知