AI「幻覺」可能在一般人看來是模型的胡言亂語,但它為科學(xué)家提供了新的靈感。David Baker 甚至利用 AI「幻覺」贏得了諾貝爾化學(xué)獎。紐約時報發(fā)文 AI 正在加速科學(xué)發(fā)展,但「幻覺」一詞,在科學(xué)界仍有爭議。
萬萬沒想到,一直備受批評的 AI「幻覺」問題,竟然在科學(xué)領(lǐng)域具有極大的應(yīng)用價值?
就在最近,計算機科學(xué)家 Amy McGovern 表示:「公眾認(rèn)為這完全是壞事。但實際上,它為科學(xué)家提供了新的靈感,讓他們得以探索一些原本可能不會想到的思路。」
AI「幻覺」可以幫助科學(xué)家通過測試「夢幻式」的新概念,來追蹤癌癥、設(shè)計藥物、發(fā)明醫(yī)療設(shè)備并揭示氣象現(xiàn)象
AI「幻覺」激發(fā)科學(xué)創(chuàng)造力
科學(xué)在人們心中的形象冷靜而理性。
然而,在科學(xué)發(fā)現(xiàn)的早期階段,往往充滿了直覺和大膽的猜想。正如科學(xué)哲學(xué)家 Paul Feyerabend 所言,這是一種「無拘無束」的探索狀態(tài)。
如今,AI 的「幻覺」正在重新激發(fā)科學(xué)的創(chuàng)造力。
這種技術(shù)加速了科學(xué)家和發(fā)明家提出新想法并驗證其是否符合現(xiàn)實的過程。
這可以被視為科學(xué)方法的加速版。以往需要數(shù)年完成的任務(wù),現(xiàn)在可能在幾天、幾小時甚至幾分鐘內(nèi)實現(xiàn)。
有時候,甚至幫助科學(xué)家加速了研究周期,開辟了全新的研究領(lǐng)域。
麻省理工學(xué)院教授 James J. Collins 說:「我們正在探索」。他最近稱贊 AI 的「幻覺」加速了他對新型抗生素的研究進展?!肝覀冏屇P吞岢鐾耆路f的分子?!?/p>
科學(xué)家向生成式計算機模型輸入特定主題的信息,然后讓機器對主題進行重新加工,從而產(chǎn)生 AI 的「幻覺」。
結(jié)果可能有細(xì)微的偏差,也可能超越現(xiàn)實。有時,它們會帶來重大發(fā)現(xiàn)。
「幻覺」帶來的諾貝爾化學(xué)獎
去年十月,華盛頓大學(xué)的 David Baker 因其開創(chuàng)性的蛋白質(zhì)研究獲得了諾貝爾化學(xué)獎。這些復(fù)雜的分子是生命活動的關(guān)鍵動力。
諾貝爾委員會稱贊他發(fā)現(xiàn)了快速構(gòu)建完全不同于自然界中蛋白質(zhì)的新方法,并稱其成就「幾乎不可能」。
在獎項宣布前的一次采訪中,Baker 博士將 AI 的「突發(fā)想象」描述為「從零開始設(shè)計蛋白質(zhì)」的關(guān)鍵。
他補充說,這項新技術(shù)幫助他的實驗室獲得了約 100 項專利,其中許多用于醫(yī)療用途。一個專利用于一種新的癌癥治療方法,另一個旨在支持全球抗擊病毒感染的工作。他還創(chuàng)辦或協(xié)助創(chuàng)立了超過 20 家生物技術(shù)公司。
他說:「發(fā)展速度非???,即使是專門研究蛋白質(zhì)的科學(xué)家,也不了解目前的進展有多大?!?/p>
他的實驗室設(shè)計了多少種蛋白質(zhì)?
他回答道:「一千萬種,而且都是全新的。它們在自然界中并不存在。」
諾貝爾獎獲得者 Baker 博士對「幻覺」采取了直截了當(dāng)?shù)膽B(tài)度。
在 2021 年,他在 Nature 上發(fā)表了一篇論文,標(biāo)題為《通過深度網(wǎng)絡(luò)幻覺進行從頭蛋白質(zhì)設(shè)計》(De novo protein design by deep network hallucination)。
論文地址:https://www.nature.com/articles/s41586-021-04184-w
標(biāo)題中的「從零(De novo)」一詞源自拉丁文,意為「從零開始」,與 1980 年代初科學(xué)家開始修改自然界已知蛋白質(zhì)結(jié)構(gòu)的做法形成了鮮明對比。
2003 年,Baker 博士及其同事實現(xiàn)了一個更宏偉的目標(biāo):從零構(gòu)建世界上第一個全新蛋白質(zhì)。
他們將其命名為 Top7。這一成就被視為一項重要的突破,因為蛋白質(zhì)的復(fù)雜性堪稱驚人。
專家將 DNA 的結(jié)構(gòu)比作一串珍珠,而將大型蛋白質(zhì)的結(jié)構(gòu)比作糾結(jié)的毛球。即使是詳細(xì)的圖示,也只能粗略地表現(xiàn)蛋白質(zhì)的復(fù)雜結(jié)構(gòu)。
在流感病毒表面的血凝素蛋白的棱周圍會形成一種粘合劑蛋白,針對這些易受攻擊的點可以阻止病菌附著在肺部和其他地方的細(xì)胞上
隨著 AI 發(fā)展成為一種強大的新技術(shù),Baker 博士開始思考它是否能夠加速從零開始的蛋白質(zhì)設(shè)計。
他在 2021 年的論文中提到,新方法受到了谷歌 DeepDream 模型的啟發(fā)。
DeepDream 模型可以將現(xiàn)有圖像轉(zhuǎn)化為迷幻風(fēng)格,創(chuàng)造全新的視覺內(nèi)容。
當(dāng)人們看滿月時看到一個人的臉,這被稱為「空想性錯覺」(pareidolia),即一種將模糊圖案轉(zhuǎn)化為有意義圖像的感知現(xiàn)象。DeepDream 正是利用了這種特性來創(chuàng)造超現(xiàn)實的圖像。
Baker 博士的計劃是測試 AI 是否可以將這種「空想性錯覺」應(yīng)用于模糊的氨基酸集合 —— 氨基酸是蛋白質(zhì)的基本構(gòu)建塊。
他的團隊將隨機的氨基酸序列輸入一個經(jīng)過訓(xùn)練的模型,而該模型能識別真實蛋白質(zhì)的結(jié)構(gòu)特征。
結(jié)果大大超出了預(yù)期。
論文指出,測試運行生成了數(shù)千種虛擬蛋白質(zhì),并將其比作互聯(lián)網(wǎng)中泛濫的貓圖片。
論文寫道:「就像由深度網(wǎng)絡(luò)幻覺生成的貓圖像可以清晰地被識別為貓一樣。這些人工蛋白質(zhì)結(jié)構(gòu)與天然結(jié)構(gòu)相似,但并不完全相同?!?/p>
隨后,貝克團隊嘗試將這些虛擬的蛋白質(zhì)轉(zhuǎn)化為現(xiàn)實 —— 這一過程類似于讓電子貓變?yōu)檎鎸嵈嬖诘纳镓垺J紫?,團隊將這些虛擬分子的結(jié)構(gòu)信息作為藍(lán)圖,用以生產(chǎn)形成基因的 DNA 鏈。接著,正如 2021 年的論文所述,當(dāng)這些基因被插入微生物體內(nèi)后,這些微生物成功產(chǎn)生了 129 種從未在科學(xué)或自然界中發(fā)現(xiàn)的新蛋白質(zhì)。
2022 年初,Baker 博士將這一成就描述為「AI 加速從零蛋白質(zhì)設(shè)計的首次實證」。
在他于 2022 年和 2023 年發(fā)表的后續(xù)論文中,「幻覺」一詞仍然出現(xiàn)在標(biāo)題中。
擴散模型帶來蛋白質(zhì)催化劑
Baker 博士表示,他的實驗室最近在創(chuàng)意生成方面取得了新突破,采用了一種稱為擴散(diffusion)的 AI 方法。這也是 DALL-E 和 Sora 等流行視覺生成器的核心技術(shù)。
Baker 博士稱贊擴散技術(shù)在設(shè)計新蛋白質(zhì)方面比「幻覺」更高效,他說:「速度更快,成功率也更高。」
近年來,一些分析人士擔(dān)心科學(xué)正在走向衰退。他們指出,過去幾十年來,突破性發(fā)現(xiàn)的數(shù)量正在減少。
AI 的支持者則認(rèn)為,創(chuàng)造性爆發(fā)正在扭轉(zhuǎn)這一趨勢。
在設(shè)計領(lǐng)域,Baker 博士及其同事看到一波波蛋白質(zhì)催化劑即將誕生。這些催化劑可能幫助收集太陽能、將老舊工廠改造成高效節(jié)能設(shè)施,并為構(gòu)建一個可持續(xù)的新世界提供支持。
Baker 團隊的成員 Ian C. Haydon 認(rèn)為這種加速仍在繼續(xù)并表示「這令人難以置信?!?/p>
「幻覺」是天才的表現(xiàn)
谷歌旗下 AI 公司 DeepMind 科學(xué)部負(fù)責(zé)人 Pushmeet Kohli 在一次采訪中稱贊了「幻覺」在促進科學(xué)發(fā)現(xiàn)方面的作用。
不久前,他的兩位同事與 David Baker 博士共同分享了 2024 年的諾貝爾化學(xué)獎。
Pushmeet Kohli 表示:「我們擁有一項能夠展現(xiàn)創(chuàng)造力的驚人工具」。
Pushmeet Kohli 博士舉了一個例子,說明了這種工具的創(chuàng)造力。
2016 年,DeepMind 的計算機在圍棋比賽中擊敗了世界冠軍。
這場比賽的轉(zhuǎn)折點是第 37 步,發(fā)生在比賽的早期階段。
Kohli 博士回憶道:「我們一開始以為那是個錯誤。但隨著比賽的進行,人們意識到那是一種天才的表現(xiàn)。因為,這些模型能夠產(chǎn)生非常新穎的見解?!?/p>
他認(rèn)同 AI 在加速生物科學(xué)的發(fā)展:「接下來的幾年中會出現(xiàn)許多令人驚嘆的成果」。
他認(rèn)為,AI 正在解鎖生命最深層的奧秘,并為治愈疾病、改善健康和延長壽命奠定了強大的新基礎(chǔ)。
他說:「一旦我們破譯并真正理解生命的語言,那將是奇跡」。
更多的「幻覺」
另一方面,曼哈頓紀(jì)念斯隆凱特琳癌癥中心實驗室負(fù)責(zé)人 Harini Veeraraghavan,在一篇關(guān)于利用 AI 改善模糊醫(yī)學(xué)圖像的論文中提到了「幻覺」一詞。
這篇論文的標(biāo)題部分直接寫道「幻覺 MRI」。
論文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC7225573/pdf/nihms-1586979.pdf
得克薩斯大學(xué)奧斯汀分校的研究人員也接受了這一術(shù)語。他們的一篇論文標(biāo)題寫道:「從幻覺中學(xué)習(xí)」,討論如何改進機器人導(dǎo)航。
論文地址:https://www.cs.utexas.edu/~xiao/papers/hallucination.pdf
「幻覺」設(shè)計的新事物需要驗證
盡管 AI「幻覺」在科學(xué)發(fā)現(xiàn)中的吸引力巨大,但一些科學(xué)家認(rèn)為這一術(shù)語具有誤導(dǎo)性。
他們認(rèn)為,生成式 AI 模型的「想象」并非完全虛幻,而是具有一定實現(xiàn)可能性的,就像科學(xué)方法早期階段的假設(shè)一樣。因此,他們認(rèn)為「幻覺」一詞不夠準(zhǔn)確,并傾向于避免使用。
此外,「幻覺」一詞還因其與迷幻藥(如 LSD)導(dǎo)致的幻覺聯(lián)想而受到質(zhì)疑。迷幻藥在過去曾讓許多嚴(yán)肅的科學(xué)研究裹足不前。
最后,在科學(xué)和醫(yī)學(xué)交流中,AI 生成的信息可能被錯誤信息所混淆,就像像聊天機器人的回復(fù)那樣,這也讓「幻覺」一詞更加備受爭議。
今年七月,白宮發(fā)布了一份關(guān)于促進公眾信任 AI 研究的報告,其中唯一提到「幻覺」的部分是關(guān)于如何減少它們的存在。
諾貝爾獎委員會似乎也遵循了這一思路。在對 Baker 博士工作的詳細(xì)評價中,沒有提及 AI「幻覺」。相反,在新聞稿中,僅稱贊了他的團隊「創(chuàng)造了一種又一種富有想象力的蛋白質(zhì)」。
科學(xué)界的部分機構(gòu)似乎越來越傾向于將「幻覺」視為一個不宜提及的詞匯。
盡管如此,專家們在紐約時報的采訪中指出,科學(xué) AI 的「想象」相比聊天機器人等的「幻覺」具有顯著優(yōu)勢。
最根本的一點是,這種創(chuàng)造性爆發(fā)基于自然和科學(xué)的硬性事實,而非人類語言的歧義或互聯(lián)網(wǎng)中的偏見和虛假信息。
「幻覺」并不可靠
加州理工學(xué)院的數(shù)學(xué)與計算機科學(xué)教授 Anima Anandkumar 表示:「我們正在教授 AI 物理學(xué)」。她曾擔(dān)任 AI 芯片領(lǐng)先制造商英偉達(dá)的 AI 研究主管。
Anandkumar 博士補充說,對于科學(xué)而言,基于可靠事實的物理學(xué)基礎(chǔ)可以帶來高度準(zhǔn)確的結(jié)果。
她指出,聊天機器人的大語言模型無法實際驗證其陳述和斷言的正確性。
她強調(diào),最終的驗證來自科學(xué)家將這些 AI 生成的構(gòu)想與物理現(xiàn)實的具體細(xì)節(jié)進行比較。
她談到 AI 的成果時說道:「你需要對其進行測試,AI 靠『幻覺』設(shè)計的新事物需要經(jīng)過驗證?!?/p>
最近,Anandkumar 博士及其同事利用 AI 的「幻覺」幫助設(shè)計了一種全新的導(dǎo)管。
這種導(dǎo)管可以顯著減少細(xì)菌污染 —— 這一全球性問題每年導(dǎo)致數(shù)百萬例尿路感染。
她表示,團隊的 AI 模型設(shè)計了數(shù)千種導(dǎo)管幾何形狀,并最終選出其中最有效的一種。
這種新導(dǎo)管的內(nèi)壁上覆蓋著鋸齒狀突起,能夠防止細(xì)菌附著并向上游移動,從而感染患者的膀胱。Anandkumar 博士提到,該團隊正在討論這種設(shè)備的商業(yè)化。
與其他科學(xué)家一樣,Anandkumar 博士表示她不喜歡「幻覺」這個術(shù)語。
她的團隊在關(guān)于新導(dǎo)管的論文中避免使用該詞。
「幻覺」是概率分布?
Amy McGovern 博士是 AI 研究所的負(fù)責(zé)人,也是俄克拉荷馬大學(xué)氣象學(xué)和計算機科學(xué)的教授。
她認(rèn)為 AI 的「幻覺」或許更適合被稱為「概率分布」—— 這是科學(xué)領(lǐng)域一個傳統(tǒng)的術(shù)語。
她補充道,天氣研究人員現(xiàn)在經(jīng)常使用 AI 來創(chuàng)建數(shù)千種細(xì)微的預(yù)測變化或概率范圍。這些豐富的想象幫助他們發(fā)現(xiàn)了可能引發(fā)極端事件(如致命熱浪)的意外因素。
她認(rèn)為這是一種非常有價值的工具。
參考資料:
https://www.nytimes.com/2024/12/23/science/ai-hallucinations-science.html#:~:text=The%20A.I.,they%20lead%20to%20major%20discoveries.
本文來自微信公眾號:新智元(ID:AI_era)
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。