設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

OpenAI 潛入黑客群聊!將盜版 ChatGPT 換成“喵喵 GPT”,網(wǎng)友:絕對(duì)的傳奇

量子位 2023/11/1 23:49:51 責(zé)編:問舟
感謝IT之家網(wǎng)友 Coje_He、西窗舊事、Alejandro86、咩咩洋 的線索投遞!

當(dāng) ChatGPT黑客“入侵”時(shí),OpenAI 會(huì)如何應(yīng)對(duì)?

掐斷 API,不讓他們用?不不不。

這幫極客們采取的做法可謂是劍走偏鋒 —— 反手一記《無間道》

故事是這樣的。

OpenAI 雖然在發(fā)布 ChatGPT 之前做了大量的安全性檢測(cè),但當(dāng)開放 API 之后,還是防不住一些居心叵測(cè)的黑客們拿它搞事情。

然后有一天,團(tuán)隊(duì)中的一個(gè)工程師突然發(fā)現(xiàn) ChatGPT 端點(diǎn)上的流量有些不太正常;在經(jīng)過一番調(diào)查之后,確定了大概率是有人在反向工程 API(盜版 API)。

不過 OpenAI 并沒有選擇立即阻止這些黑客,因?yàn)槿绻麍F(tuán)隊(duì)這樣做了,黑客們就會(huì)馬上發(fā)現(xiàn)異樣,然后改變策略繼續(xù)攻擊。

這時(shí),團(tuán)隊(duì)里一個(gè)“大聰明”就支了個(gè)妙招:

我們搞成“catGPT”,每個(gè) token 都是“meow”……

“陷阱”布置成功后,黑客大兄弟再向 ChatGPT 提問時(shí),畫風(fēng)就是這樣?jì)饍旱牧耍?/p>

沒錯(cuò),不管問啥,回答都是“喵言喵語”

喵,我不知道。我是只貓,不是只鳥!

這位黑客大兄弟起初還不知道自己早已落入“陷阱”,還發(fā)帖描述了自己神奇的經(jīng)歷。

不過黑客團(tuán)伙中很快有人察覺到了異樣:

兩個(gè)代理都出現(xiàn)了同樣的情況;我覺得我們完了(暴露了)。

團(tuán)伙中還有人在 Discord 社區(qū)中這樣討論:

兄弟,你覺得 OpenAI 是發(fā)現(xiàn)了我們?cè)冢帽I版 API)用模型,然后開始拿“貓語 prompt”來回答我們嗎?

若真如此,那也太搞笑了吧!

殊不知,OpenAI 的成員們?cè)缇蜐撊肓?Discord 社區(qū),觀望著黑客們的對(duì)話……

黑客們最終還是發(fā)現(xiàn)了真相,后知后覺的他們,最終在 Discord 中給 OpenAI 的團(tuán)隊(duì)發(fā)話了:

我很失望。我知道 OpenAI 的某人正在讀這段文字。

你們有千載難逢的機(jī)會(huì)給我們來個(gè)“Rick Astley”(發(fā)現(xiàn)被整蠱時(shí)用的橋段),你們竟然就搞個(gè)貓。

對(duì)此,OpenAI 的成員表示:“收到,下次我們會(huì)的”。

上面這個(gè)有趣的故事,其實(shí)是一位 OpenAI 工程師 Evan Morikawa 在一場(chǎng)技術(shù)分享活動(dòng)中自曝的。

不少網(wǎng)友在看完這個(gè)故事之后,紛紛感慨道:

絕對(duì)的傳奇!

雖然故事很精彩、很有趣,不過言歸正傳,這也從側(cè)面反映出了目前大模型時(shí)代下所存在的安全隱患。

正如 Evan 在活動(dòng)中所說:

隨著模型變得越來越強(qiáng)大,它們?cè)趬娜耸种锌赡茉斐傻膫ψ兊酶?,我們?cè)谶@里的警惕性確實(shí)需要成倍增加。

除此之外,Evan 在活動(dòng)中還分享了兩個(gè)與 OpenAI、ChatGPT 相關(guān)的“隱秘的故事”。

我們繼續(xù)往下看。

OpenAI:GPU 夠的話,發(fā)布早就提前了

Evan 先是回顧了 ChatGPT 最初爆火的盛況:

從內(nèi)部決定發(fā)布,到后來意外走紅,就連馬斯克都發(fā)推討論等等。

隨之而來的便是大量用戶的涌入,當(dāng)時(shí)他們自己也很擔(dān)心,因?yàn)橐运麄?GPU 的能力,完全 hold 不住那么大的負(fù)載。

然后 Evan 在現(xiàn)場(chǎng)展示了他們?yōu)?ChatGPT 提供動(dòng)力的計(jì)算機(jī),里面有 8 個(gè)英偉達(dá) A100 GPU:

每個(gè) GPU 上還都附加了特殊的 HPM 高帶寬內(nèi)存;至關(guān)重要的是,他們還需要所有 GPU 相互通信:

Evan 表示,里面的每個(gè)環(huán)節(jié)的性能都會(huì)影響 ChatGPT 最終的體驗(yàn)感。

接下來,Evan 站在現(xiàn)在這個(gè)時(shí)間節(jié)點(diǎn),回顧并總結(jié)了 OpenAI 最初在 GPU 上所遇到的瓶頸。

1、GPU 內(nèi)存不足

由于 ChatGPT 的模型非常大,需要占用大量 GPU 內(nèi)存來存儲(chǔ)模型權(quán)重。而 GPU 上的高帶寬內(nèi)存非常昂貴和有限,不夠用來同時(shí)服務(wù)大量用戶請(qǐng)求。這成為第一個(gè)瓶頸。

2、計(jì)算效率低下

初期通過簡單的 GPU 利用率指標(biāo)監(jiān)控存在問題,沒有充分考慮到 tensor 運(yùn)算的內(nèi)存訪問模式。導(dǎo)致 GPU 算力沒有被充分利用,浪費(fèi)了寶貴的計(jì)算資源。

3、難以擴(kuò)容

ChatGPT 流量暴增,但受限于整個(gè) GPU 供應(yīng)鏈,短時(shí)間內(nèi)無法擴(kuò)充 GPU 服務(wù)器數(shù)量,不得不限制用戶訪問。無法自動(dòng)擴(kuò)容成為重大挑戰(zhàn)。

4、多樣化負(fù)載特征

隨著用戶使用模式的變化,不同模型和請(qǐng)求類型對(duì) GPU 的計(jì)算方式和內(nèi)存訪問模式需要不斷調(diào)整,優(yōu)化難度大。

5、分布式訓(xùn)練困難

GPU 之間的通信和數(shù)據(jù)交換成為訓(xùn)練架構(gòu)中新的瓶頸。

可以看出,OpenAI 開始將 GPU 用于部署大模型服務(wù)時(shí),確實(shí)因?yàn)榻?jīng)驗(yàn)不足而遇到一些系統(tǒng)級(jí)別的困難。但通過不斷調(diào)整策略和深入優(yōu)化,才使 ChatGPT 得以穩(wěn)定運(yùn)行。

而且 Evan 還爆料說:

如果不是因?yàn)?GPU 短缺,去年產(chǎn)品和功能的發(fā)布速度會(huì)更快。

我們已經(jīng)準(zhǔn)備好了東西了,但我們也知道無法處理負(fù)載。

基于上述的挑戰(zhàn),Evan 分享了 OpenAI 總結(jié)出的經(jīng)驗(yàn)教訓(xùn):

把問題視為系統(tǒng)工程挑戰(zhàn),而不僅僅是研究項(xiàng)目;需要優(yōu)化各個(gè)系統(tǒng)組件的協(xié)同工作,如緩存、網(wǎng)絡(luò)、批處理大小等。

要深入了解硬件的底層細(xì)節(jié)及其對(duì)系統(tǒng)的影響,如 GPU 內(nèi)存帶寬、ops / bytes 等對(duì)性能的影響;不能停留在表面指標(biāo)。

不斷根據(jù)模型和場(chǎng)景變化對(duì)系統(tǒng)進(jìn)行調(diào)優(yōu);不同的模型結(jié)構(gòu)和使用場(chǎng)景會(huì)對(duì)系統(tǒng)提出不同要求。

要考慮到硬件的各種限制,如內(nèi)存和算力均衡、擴(kuò)容限制等,這會(huì)影響產(chǎn)品路線圖;不能簡單地套用傳統(tǒng)的云擴(kuò)展經(jīng)驗(yàn)。

把 ChatGPT 看成初創(chuàng)公司

至于團(tuán)隊(duì)方面,Evan 也有所介紹。

ChatGPT 啟動(dòng)時(shí),應(yīng)用工程團(tuán)隊(duì)只有 30 人左右,發(fā)布 10 個(gè)月后才擴(kuò)充到近 100 人。

OpenAI 一直在員工數(shù)量增長與保持高人才密度之間尋找平衡,他們最初希望團(tuán)隊(duì)盡可能小,這樣可以保持高效的迭代文化。

不過后來隨著產(chǎn)品規(guī)模增長,很多職能只有幾個(gè)人在支撐,這樣就會(huì)存在一定風(fēng)險(xiǎn),因此才決定進(jìn)行一定擴(kuò)張。

Evan 對(duì)于團(tuán)隊(duì)建設(shè)方面的分享,有一個(gè)觀點(diǎn)是值得劃重點(diǎn)的。

那就是他認(rèn)為:

不要把 ChatGPT 看成是 OpenAI 的一個(gè)部門。

他們?cè)谌昵熬蛧L試過用 API 做類似 ChatGPT 的事情,因此在 Evan 看來 ——

ChatGPT 更像是個(gè) 10 月大的初創(chuàng)公司嵌套到了 3 年前的初創(chuàng)公司;而這個(gè)三年前的初創(chuàng)公司,又嵌套在一個(gè) 8 年前的初創(chuàng)公司(即 OpenAI)。

接下來,如果公司還會(huì)出現(xiàn)新的產(chǎn)品,Evan 希望還是能夠保持沿用這種模式。

參考鏈接:

  • [1]https://www.youtube.com/watch?v=PeKMEXUrlq4

  • [2]https://twitter.com/random_walker/status/1719342958137233605?s=20

  • [3]https://twitter.com/nearcyan/status/1719225443788935372?s=20

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:OpenAI,ChatGPT

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知