設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

跟 AI 嘮嗑,年入 33 萬(wàn)美元,prompt 成核心競(jìng)爭(zhēng)力

新智元 2023/2/20 20:39:04 責(zé)編:夢(mèng)澤

AI 在我們的生活中,越來(lái)越不可或缺。顯然,誰(shuí)能更好地掌握提示工程,就能比別人多掌握一個(gè)強(qiáng)大的利器。

ChatGPT 的爆火,也讓提示工程師的薪水水漲船高。

現(xiàn)在,已經(jīng)有人拿到 25 萬(wàn)到 33 萬(wàn)美元的年薪了。

21 世紀(jì)的重要技能:提示工程

以迅雷不及掩耳之勢(shì),人工智能軍備競(jìng)賽已經(jīng)打響。

谷歌發(fā)布了基于大規(guī)模語(yǔ)言模型 LaMDA 的搜索聊天機(jī)器人 Bard,微軟公布了由 ChatGPT 驅(qū)動(dòng)的下一代 Edge 瀏覽器以及全新的搜索引擎必應(yīng) Bing。

盡管大型科技公司這些年來(lái)一直都在悄悄地開(kāi)發(fā)自己的生成式人工智能工具,但自從 OpenAI 的 ChatGPT 迅速走紅之后,這些巨頭們便開(kāi)始爭(zhēng)先恐后地向公眾展示自己的能力。

而生成式 AI 這項(xiàng)技術(shù),也被認(rèn)為注定會(huì)成為從搜索引擎到故事編寫、科學(xué)研究、家庭作業(yè)、學(xué)校教學(xué)等等創(chuàng)造性或重復(fù)性工作的替代品。在這一語(yǔ)境下,它將重塑這個(gè)世界。

如果這種人工智能范式的轉(zhuǎn)變真的到來(lái),那么 21 世紀(jì)的一項(xiàng)重要技能就很可能是如何有效地與機(jī)器對(duì)話,或者也可以稱之為「提示工程」。

像 DALL-E 2 和 Midjourney 這樣的圖像生成模型,以及像 ChatGPT 這樣的文本生成工具,都將是一種創(chuàng)造的手段。但成功利用它們的前提是,我們先要了解如何引導(dǎo) AI 實(shí)現(xiàn)預(yù)期的結(jié)果。

比如,要求 ChatGPT 寫一份關(guān)于《動(dòng)物農(nóng)場(chǎng)》的五段式讀書(shū)報(bào)告,可能會(huì)產(chǎn)生令人印象深刻,但并不準(zhǔn)確的結(jié)果。

但如果給 AI 一個(gè)明確的提示:「用優(yōu)雅的散文寫一篇大學(xué)水平的五段式讀書(shū)報(bào)告,借鑒諷刺性寓言小說(shuō)《動(dòng)物農(nóng)場(chǎng)》的歷史。參考奧威爾的《我為什么要寫作》,同時(shí)解釋作者在小說(shuō)中的風(fēng)格選擇」,便可以產(chǎn)生一個(gè)更加成熟和有說(shuō)服力的輸出結(jié)果。

可以說(shuō),好的提示不僅僅是具體的,而且還反映出了你想要讓 AI 做什么的更深層的理解。

全新的職業(yè):提示工程師

美國(guó)知名作家 Charlie Warzel 分享了他和自己 8 歲的侄子,在去年夏天一起體驗(yàn) Midjourney 的故事。

他們?cè)臼窍雱?chuàng)造出一個(gè)令人愉快的場(chǎng)景:「一只跳蚤在海嘯的浪潮中沖浪,與一只巨大的黃蜂搏斗」。

但結(jié)果卻是,跳蚤在最開(kāi)始看起來(lái)不夠卡通,而經(jīng)過(guò)這位作者調(diào)整后又太過(guò)于超現(xiàn)實(shí),完全超出了他侄子那個(gè)年齡的接受范圍。

這位作家表示,雖然自己以寫作為生,但很顯然,他在指導(dǎo) AI 時(shí)所要的描述還是太含糊了,至少對(duì)于 AI 來(lái)說(shuō)是這樣的。

不過(guò),就算搞不懂如何與 AI 對(duì)話也沒(méi)關(guān)系,因?yàn)楝F(xiàn)在有了一個(gè)全新的產(chǎn)業(yè)可以幫你玩轉(zhuǎn) AIGC——「提示專賣店」。

比如,在網(wǎng)站 PromptBase 上,你就能以非常低廉的價(jià)格,買到讓 AI 穩(wěn)定輸出某一主題的 prompt。

網(wǎng)站地址:https://promptbase.com/

在這里,從 DALL-E 到 Midjourney 再到 Stable Diffusion,各類的提示應(yīng)有盡有。

PromptBase 上最火的 prompt 之一,就是用 DALL-E 2 以黏土風(fēng)格生成的可愛(ài) 3D emoji。

或者花 2.99 刀,就能讓 Stable Diffusion 無(wú)限生成風(fēng)格相似的電影女主角。

PromptBase 排名第六的賣家,是一位昵稱是叫 Imagineer 的西班牙人,他表示,提示工程只是一項(xiàng)副業(yè),畢竟自 9 月以來(lái)他只賺了 800 多歐元?!笇?duì)我來(lái)說(shuō),這更像一個(gè)游戲。這些 prompt 都是我的小寶貝?!?/p>

Imagineer 的提示寫作過(guò)程是以設(shè)計(jì)、插圖和攝影的知識(shí)為基礎(chǔ)的。

當(dāng)被問(wèn)起為什么認(rèn)為自己擅長(zhǎng)寫提示語(yǔ)時(shí),Imagineer 認(rèn)為這是自然技能和策略的融合。他說(shuō):「我意識(shí)到,我比其他人更擅長(zhǎng)與 Midjourney 交談。而且在 Midjourney 中,經(jīng)驗(yàn)可以服用,比起 DALL-E 2 和 Stable Diffusion,較少的努力就可以產(chǎn)生巨大的成果?!?/p>

Imagineer 表示,其中最關(guān)鍵的因素就是迭代,當(dāng)你產(chǎn)生大量的圖像,并改變一些詞語(yǔ)或參數(shù)時(shí),一個(gè)好的提示「會(huì)產(chǎn)生一致的、可預(yù)測(cè)的結(jié)果」。

而在提示工程中,對(duì)相關(guān)領(lǐng)域?qū)I(yè)知識(shí)的掌握,也是必不可少的。

Dan Shipper 是一位企業(yè)家兼作家,自從 ChatGPT 在 11 月發(fā)布以來(lái),他一直在使用 ChatGPT 來(lái)輔助撰寫博客文章,文章主題是人工智能工具的未來(lái)。

當(dāng)他需要描述一個(gè)概念時(shí)(比如說(shuō),寫一篇關(guān)于失寵的加密貨幣 CEO Sam Bankman-Fried 的文章時(shí),需要用到有效利他主義的哲學(xué)理論),他會(huì)要求 ChatGPT 用幾句話為普通讀者總結(jié)出有效利他主義的關(guān)鍵點(diǎn)。

ChatGPT 輸出文本之后,Shipper 就會(huì)檢查文本是否準(zhǔn)確,然后用自己的修辭手法使句子變得更漂亮。

Shipper 表示:ChatGPT 讓我跳過(guò)了一個(gè)步驟,但前提是我知道自己在說(shuō)什么,這樣我才能寫出一個(gè)好的提示,然后對(duì)才能對(duì)輸出的內(nèi)容進(jìn)行事實(shí)核查。

Shipper 把提示 ChatGPT 的工作比作管理一個(gè)聰明而熱心的初級(jí)雇員。

ChatGPT 熱情、熟練,但也缺乏經(jīng)驗(yàn),因此更有可能犯一些細(xì)微但關(guān)鍵的錯(cuò)誤。當(dāng)它不知道答案的時(shí)候,它就非常擅長(zhǎng)胡說(shuō)八道。

Shipper 總結(jié)道,品味和經(jīng)驗(yàn)是創(chuàng)造一個(gè)成功的 prompt 的必要條件。

比如,他會(huì)讓 ChatGPT 為他正在寫的一篇長(zhǎng)文,寫一個(gè)令人印象深刻的、透徹的大綱。

「我寫了一堆要點(diǎn),然后告訴 ChatGPT:這是我積累的各種名言、想法和短語(yǔ)。然后我寫道:你能不能把它寫成一篇論文的大綱?」顯然,Shipper 在微調(diào)提示方面做的工作越多,產(chǎn)出就越好。

有時(shí),提示寫作本身就讓人有一種特殊的喜悅。

Meg Conley 是一位在業(yè)余時(shí)間使用 AI 工具的作家,她認(rèn)為提示工程是一種挑戰(zhàn),類似于寫作一篇有說(shuō)服力的文章。

「提示工程非常困難,常常失敗?!?她在 11 月的推特上寫道:「當(dāng)文字組合出的東西看起來(lái)有點(diǎn)像你腦海中的世界時(shí),就會(huì)有純粹的快樂(lè)」。

但 Conley 的經(jīng)歷比較特殊。她患有心盲癥,因此想象圖像對(duì)她來(lái)說(shuō)很困難。在 Midjourney 發(fā)布后,她時(shí)常熬夜描述自己想象中的事物,不斷打磨 prompt,直到產(chǎn)生的圖像變得正確。

在 Conley 看來(lái),最重要的就是要了解你面前這個(gè)模型。每個(gè)工具都是以不同的方式建造和訓(xùn)練的,因而它們具有獨(dú)特的美學(xué)和方言,就像共享一種語(yǔ)言的人會(huì)有方言和文化怪癖一樣。

「就像寫散文與學(xué)術(shù)寫作不同一樣,聽(tīng)眾不同,就會(huì)有不同的語(yǔ)言表達(dá)方式?!?/p>

「我見(jiàn)過(guò)真正擅長(zhǎng) DALL-E 2 的人,似乎借鑒參考資料和雅俗文化混搭的能力越強(qiáng)的人,就越擅長(zhǎng)。但我構(gòu)思世界的方式更多的是沿著 Midjourney 的模式工作?!?/p>

隨著時(shí)間的推移,Conley 已經(jīng)非常熟悉 Midjourney 的操作順序。

在 Midjourney 中,如果你在形容詞紅色之前輸入女孩這個(gè)詞,它就會(huì)更關(guān)注女孩而不是紅色。

當(dāng)有更長(zhǎng)的提示時(shí),它就像一個(gè)謎題,你需要去解迷,知道哪些術(shù)語(yǔ)應(yīng)該被給予更多的重視。

聰明的老師,已經(jīng)在訓(xùn)練學(xué)生用 ChatGPT 了

雖然很多老師把 ChatGPT 視為洪水猛獸,但是已經(jīng)有一部分開(kāi)明的教授認(rèn)識(shí)到:學(xué)會(huì)用 prompt 是學(xué)生們?cè)趯W(xué)業(yè)生涯中必備的一項(xiàng)技能。

賓夕法尼亞大學(xué)教授 Ethan Mollick 在教一門「創(chuàng)新和創(chuàng)業(yè)」課,在 ChatGPT 發(fā)布后,他修改了教學(xué)大綱。

在他的一門新課中,Mollick 要求他的學(xué)生把 ChatGPT 想象成一個(gè)學(xué)生,并通過(guò) prompt 來(lái)教這個(gè)機(jī)器人,讓它寫一篇關(guān)于特定課程概念的文章。

在這個(gè)過(guò)程中,學(xué)生們必須像教授一樣,幫助 ChatGPT 完善這篇文章,直到讓它看起來(lái)已經(jīng)完全掌握這個(gè)主題。

Mollick 希望,這個(gè)練習(xí)能幫助學(xué)生通過(guò)解釋來(lái)學(xué)習(xí),還能讓他們學(xué)會(huì)寫出靈巧的提示語(yǔ)。

在 Mollick 看來(lái),提示工程是一個(gè)處于語(yǔ)言學(xué)和解決問(wèn)題之間的地帶。

「提示就像是用散文編程,會(huì)產(chǎn)生奇怪和隨機(jī)的結(jié)果。而好的提示會(huì)獎(jiǎng)勵(lì)那些能夠快速找到實(shí)驗(yàn)方法的、具有發(fā)散性思維的人。它獎(jiǎng)勵(lì)的是有深度好奇心的人?!?/p>

并且,ChatGPT 也會(huì)對(duì)更深層次的技術(shù)知識(shí)給出獎(jiǎng)勵(lì)。

在 Midjourney 的 Discord 服務(wù)器上,有一張引人注目的圖片是,它是用下面這個(gè)詳細(xì)到痛苦的 prompt 生成的。

形而上畫(huà)派的風(fēng)格,用彩色鉛筆繪制出順暢的陰影和混合,日出照映在深山老林的池塘中,柳樹(shù)的枝椏掛在池塘的邊緣,喜怒無(wú)常,強(qiáng)烈的情感,深刻的透視,自然的照明,超精細(xì),超級(jí)高的對(duì)比度,復(fù)雜的細(xì)節(jié),攝影,光線追蹤,octane render,虛幻引擎 --ar 3:2 --s 999 --chaos 50 --v 4 --v 4 -

其實(shí),這個(gè)過(guò)程不僅僅需要具體性,好的提示往往會(huì)顯示出對(duì)用戶復(fù)制媒介能力的意識(shí)。

Octane Render 和虛幻引擎是制作 3D 圖形的數(shù)字動(dòng)畫(huà)工具。

而像「-- v4」這樣的輸入,是在指示 Midjourney 使用這個(gè)模型更新、更強(qiáng)大、實(shí)驗(yàn)性的版本。

為什么某些提示可以生成逼真的圖像?因?yàn)樗鼈儠?huì)要求模型模仿特定的相機(jī)或鏡頭,或者運(yùn)用了一些藝術(shù)史或特定藝術(shù)風(fēng)格的知識(shí)。

這不禁讓人想起搜索的早期,在那個(gè)時(shí)候,能夠駕馭布爾運(yùn)算符、作者、關(guān)鍵詞、來(lái)源和日期范圍搜索的專家,就可以解鎖更好的結(jié)果。

當(dāng)然,如今的搜索引擎,早已變得不再那么苛刻。

為了迎合大眾,谷歌的工具已經(jīng)變得更加強(qiáng)大,讓用戶可以通過(guò)簡(jiǎn)單甚至笨拙的查詢,就能獲得高質(zhì)量的結(jié)果。

在 Mollick 看來(lái),提示工程只是一種我們與人工智能互動(dòng)的基本方式,我們的目的是,讓它們通過(guò)赤裸裸的提示,或者其他未知手段,來(lái)合成我們想要的東西。

他的看法很可能是對(duì)的。

某些看過(guò) Open AI 未公開(kāi)的 GPT-4 模型早期測(cè)試的人說(shuō),它就像科幻小說(shuō)中的東西,等它出來(lái)之后,一切舊工具都會(huì)過(guò)時(shí)。

微軟的發(fā)布會(huì)已經(jīng)為我們展示了這樣一種可能:聊天機(jī)器人會(huì)像個(gè)人助理一樣與我們交談。

你不需要搜索本田奧德賽有多大,以及宜家 Klippan 沙發(fā)的尺寸。你可以直接問(wèn)它:宜家 Klippan 沙發(fā)能裝進(jìn)我 2019 年的本田奧德賽嗎?

即時(shí)工程可能只是一座橋梁,讓我們進(jìn)入勇敢的新世界,不管接下來(lái)會(huì)出現(xiàn)什么樣的生成媒體景觀,但現(xiàn)在,我們還很難知道這在多大程度上屬于炒作。

而現(xiàn)在,Warzel 表示,在范式轉(zhuǎn)變之前,自家仍然被人工智能的提示所吸引。

在他看來(lái),這些提示通常比它們的產(chǎn)出更加耐人尋味。

當(dāng)人們分享人工智能生成的藝術(shù)或文本時(shí),他們經(jīng)常會(huì)把 prompt 一起分享出來(lái)。

在指令和最終結(jié)果之間來(lái)回穿梭很有意義,甚至讓人感到一種親密。

這種感覺(jué)有點(diǎn)像允許你進(jìn)入 ta 的大腦,看 ta 是如何把不同的知識(shí)點(diǎn)拼湊在一起,如何推理出一個(gè)問(wèn)題,如何運(yùn)用 ta 的創(chuàng)造力,來(lái)產(chǎn)生一些意想不到的東西。

就像寫作和編碼一樣,提示工程是一種新興的思維形式。

它介于對(duì)話和查詢之間,介于編程和散文之間。

它是這個(gè)快速變化的、不確定的未來(lái)中的一個(gè)部分,讓人感覺(jué)到非?!溉祟悺?。

參考資料:

  • https://www.theatlantic.com/technology/archive/2023/02/openai-text-models-google-search-engine-bard-chatbot-chatgpt-prompt-writing/672991/

本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:ChatGPT,提示工程師

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知