首頁 > 科學(xué)探索>科技前沿

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

量子位 2023/11/1 23:49:51 責(zé)編：問舟

評(píng)論：

感謝IT之家網(wǎng)友 Coje_He、西窗舊事、Alejandro86、咩咩洋的線索投遞！

當(dāng) ChatGPT 被黑客“入侵”時(shí)，OpenAI 會(huì)如何應(yīng)對(duì)？

掐斷 API，不讓他們用？不不不。

這幫極客們采取的做法可謂是劍走偏鋒 —— 反手一記《無間道》。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

故事是這樣的。

OpenAI 雖然在發(fā)布 ChatGPT 之前做了大量的安全性檢測(cè)，但當(dāng)開放 API 之后，還是防不住一些居心叵測(cè)的黑客們拿它搞事情。

然后有一天，團(tuán)隊(duì)中的一個(gè)工程師突然發(fā)現(xiàn) ChatGPT 端點(diǎn)上的流量有些不太正常；在經(jīng)過一番調(diào)查之后，確定了大概率是有人在反向工程 API（盜版 API）。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

不過 OpenAI 并沒有選擇立即阻止這些黑客，因?yàn)槿绻麍F(tuán)隊(duì)這樣做了，黑客們就會(huì)馬上發(fā)現(xiàn)異樣，然后改變策略繼續(xù)攻擊。

這時(shí)，團(tuán)隊(duì)里一個(gè)“大聰明”就支了個(gè)妙招：

我們搞成“catGPT”，每個(gè) token 都是“meow”……

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

“陷阱”布置成功后，黑客大兄弟再向 ChatGPT 提問時(shí)，畫風(fēng)就是這樣?jì)饍旱牧耍?/p>

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

沒錯(cuò)，不管問啥，回答都是“喵言喵語”：

喵，我不知道。我是只貓，不是只鳥！

這位黑客大兄弟起初還不知道自己早已落入“陷阱”，還發(fā)帖描述了自己神奇的經(jīng)歷。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

不過黑客團(tuán)伙中很快有人察覺到了異樣：

兩個(gè)代理都出現(xiàn)了同樣的情況；我覺得我們完了（暴露了）。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

團(tuán)伙中還有人在 Discord 社區(qū)中這樣討論：

兄弟，你覺得 OpenAI 是發(fā)現(xiàn)了我們?cè)冢帽I版 API）用模型，然后開始拿“貓語 prompt”來回答我們嗎？
若真如此，那也太搞笑了吧！

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

殊不知，OpenAI 的成員們?cè)缇蜐撊肓?Discord 社區(qū)，觀望著黑客們的對(duì)話……

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

黑客們最終還是發(fā)現(xiàn)了真相，后知后覺的他們，最終在 Discord 中給 OpenAI 的團(tuán)隊(duì)發(fā)話了：

我很失望。我知道 OpenAI 的某人正在讀這段文字。
你們有千載難逢的機(jī)會(huì)給我們來個(gè)“Rick Astley”（發(fā)現(xiàn)被整蠱時(shí)用的橋段），你們竟然就搞個(gè)貓。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

對(duì)此，OpenAI 的成員表示：“收到，下次我們會(huì)的”。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

上面這個(gè)有趣的故事，其實(shí)是一位 OpenAI 工程師 Evan Morikawa 在一場(chǎng)技術(shù)分享活動(dòng)中自曝的。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

不少網(wǎng)友在看完這個(gè)故事之后，紛紛感慨道：

絕對(duì)的傳奇！

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

雖然故事很精彩、很有趣，不過言歸正傳，這也從側(cè)面反映出了目前大模型時(shí)代下所存在的安全隱患。

正如 Evan 在活動(dòng)中所說：

隨著模型變得越來越強(qiáng)大，它們?cè)趬娜耸种锌赡茉斐傻膫ψ兊酶?，我們?cè)谶@里的警惕性確實(shí)需要成倍增加。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

除此之外，Evan 在活動(dòng)中還分享了兩個(gè)與 OpenAI、ChatGPT 相關(guān)的“隱秘的故事”。

我們繼續(xù)往下看。

OpenAI：GPU 夠的話，發(fā)布早就提前了

Evan 先是回顧了 ChatGPT 最初爆火的盛況：

從內(nèi)部決定發(fā)布，到后來意外走紅，就連馬斯克都發(fā)推討論等等。

隨之而來的便是大量用戶的涌入，當(dāng)時(shí)他們自己也很擔(dān)心，因?yàn)橐运麄?GPU 的能力，完全 hold 不住那么大的負(fù)載。

然后 Evan 在現(xiàn)場(chǎng)展示了他們?yōu)?ChatGPT 提供動(dòng)力的計(jì)算機(jī)，里面有 8 個(gè)英偉達(dá) A100 GPU：

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

每個(gè) GPU 上還都附加了特殊的 HPM 高帶寬內(nèi)存；至關(guān)重要的是，他們還需要所有 GPU 相互通信：

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

Evan 表示，里面的每個(gè)環(huán)節(jié)的性能都會(huì)影響 ChatGPT 最終的體驗(yàn)感。

接下來，Evan 站在現(xiàn)在這個(gè)時(shí)間節(jié)點(diǎn)，回顧并總結(jié)了 OpenAI 最初在 GPU 上所遇到的瓶頸。

1、GPU 內(nèi)存不足

由于 ChatGPT 的模型非常大，需要占用大量 GPU 內(nèi)存來存儲(chǔ)模型權(quán)重。而 GPU 上的高帶寬內(nèi)存非常昂貴和有限，不夠用來同時(shí)服務(wù)大量用戶請(qǐng)求。這成為第一個(gè)瓶頸。

2、計(jì)算效率低下

初期通過簡單的 GPU 利用率指標(biāo)監(jiān)控存在問題，沒有充分考慮到 tensor 運(yùn)算的內(nèi)存訪問模式。導(dǎo)致 GPU 算力沒有被充分利用，浪費(fèi)了寶貴的計(jì)算資源。

3、難以擴(kuò)容

ChatGPT 流量暴增，但受限于整個(gè) GPU 供應(yīng)鏈，短時(shí)間內(nèi)無法擴(kuò)充 GPU 服務(wù)器數(shù)量，不得不限制用戶訪問。無法自動(dòng)擴(kuò)容成為重大挑戰(zhàn)。

4、多樣化負(fù)載特征

隨著用戶使用模式的變化，不同模型和請(qǐng)求類型對(duì) GPU 的計(jì)算方式和內(nèi)存訪問模式需要不斷調(diào)整，優(yōu)化難度大。

5、分布式訓(xùn)練困難

GPU 之間的通信和數(shù)據(jù)交換成為訓(xùn)練架構(gòu)中新的瓶頸。

可以看出，OpenAI 開始將 GPU 用于部署大模型服務(wù)時(shí)，確實(shí)因?yàn)榻?jīng)驗(yàn)不足而遇到一些系統(tǒng)級(jí)別的困難。但通過不斷調(diào)整策略和深入優(yōu)化，才使 ChatGPT 得以穩(wěn)定運(yùn)行。

而且 Evan 還爆料說：

如果不是因?yàn)?GPU 短缺，去年產(chǎn)品和功能的發(fā)布速度會(huì)更快。
我們已經(jīng)準(zhǔn)備好了東西了，但我們也知道無法處理負(fù)載。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

基于上述的挑戰(zhàn)，Evan 分享了 OpenAI 總結(jié)出的經(jīng)驗(yàn)教訓(xùn)：

把問題視為系統(tǒng)工程挑戰(zhàn)，而不僅僅是研究項(xiàng)目；需要優(yōu)化各個(gè)系統(tǒng)組件的協(xié)同工作，如緩存、網(wǎng)絡(luò)、批處理大小等。

要深入了解硬件的底層細(xì)節(jié)及其對(duì)系統(tǒng)的影響，如 GPU 內(nèi)存帶寬、ops / bytes 等對(duì)性能的影響；不能停留在表面指標(biāo)。

不斷根據(jù)模型和場(chǎng)景變化對(duì)系統(tǒng)進(jìn)行調(diào)優(yōu)；不同的模型結(jié)構(gòu)和使用場(chǎng)景會(huì)對(duì)系統(tǒng)提出不同要求。

要考慮到硬件的各種限制，如內(nèi)存和算力均衡、擴(kuò)容限制等，這會(huì)影響產(chǎn)品路線圖；不能簡單地套用傳統(tǒng)的云擴(kuò)展經(jīng)驗(yàn)。

把 ChatGPT 看成初創(chuàng)公司

至于團(tuán)隊(duì)方面，Evan 也有所介紹。

ChatGPT 啟動(dòng)時(shí)，應(yīng)用工程團(tuán)隊(duì)只有 30 人左右，發(fā)布 10 個(gè)月后才擴(kuò)充到近 100 人。

OpenAI 一直在員工數(shù)量增長與保持高人才密度之間尋找平衡，他們最初希望團(tuán)隊(duì)盡可能小，這樣可以保持高效的迭代文化。

不過后來隨著產(chǎn)品規(guī)模增長，很多職能只有幾個(gè)人在支撐，這樣就會(huì)存在一定風(fēng)險(xiǎn)，因此才決定進(jìn)行一定擴(kuò)張。

Evan 對(duì)于團(tuán)隊(duì)建設(shè)方面的分享，有一個(gè)觀點(diǎn)是值得劃重點(diǎn)的。

那就是他認(rèn)為：

不要把 ChatGPT 看成是 OpenAI 的一個(gè)部門。

他們?cè)谌昵熬蛧L試過用 API 做類似 ChatGPT 的事情，因此在 Evan 看來 ——

ChatGPT 更像是個(gè) 10 月大的初創(chuàng)公司嵌套到了 3 年前的初創(chuàng)公司；而這個(gè)三年前的初創(chuàng)公司，又嵌套在一個(gè) 8 年前的初創(chuàng)公司（即 OpenAI）。

接下來，如果公司還會(huì)出現(xiàn)新的產(chǎn)品，Evan 希望還是能夠保持沿用這種模式。

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

參考鏈接：

[1]https://www.youtube.com/watch?v=PeKMEXUrlq4
[2]https://twitter.com/random_walker/status/1719342958137233605?s=20
[3]https://twitter.com/nearcyan/status/1719225443788935372?s=20

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

OpenAI：GPU 夠的話，發(fā)布早就提前了

把 ChatGPT 看成初創(chuàng)公司

相關(guān)文章

OpenAI 潛入黑客群聊！將盜版 ChatGPT 換成“喵喵 GPT”，網(wǎng)友：絕對(duì)的傳奇

OpenAI：GPU 夠的話，發(fā)布早就提前了