AI「幻覺」可能在一般人看來是模型的胡言亂語,但它為科學家提供了新的靈感。David Baker 甚至利用 AI「幻覺」贏得了諾貝爾化學獎。紐約時報發(fā)文 AI 正在加速科學發(fā)展,但「幻覺」一詞,在科學界仍有爭議。
萬萬沒想到,一直備受批評的 AI「幻覺」問題,竟然在科學領域具有極大的應用價值?
就在最近,計算機科學家 Amy McGovern 表示:「公眾認為這完全是壞事。但實際上,它為科學家提供了新的靈感,讓他們得以探索一些原本可能不會想到的思路?!?/p>
AI「幻覺」可以幫助科學家通過測試「夢幻式」的新概念,來追蹤癌癥、設計藥物、發(fā)明醫(yī)療設備并揭示氣象現(xiàn)象
AI「幻覺」激發(fā)科學創(chuàng)造力
科學在人們心中的形象冷靜而理性。
然而,在科學發(fā)現(xiàn)的早期階段,往往充滿了直覺和大膽的猜想。正如科學哲學家 Paul Feyerabend 所言,這是一種「無拘無束」的探索狀態(tài)。
如今,AI 的「幻覺」正在重新激發(fā)科學的創(chuàng)造力。
這種技術加速了科學家和發(fā)明家提出新想法并驗證其是否符合現(xiàn)實的過程。
這可以被視為科學方法的加速版。以往需要數(shù)年完成的任務,現(xiàn)在可能在幾天、幾小時甚至幾分鐘內實現(xiàn)。
有時候,甚至幫助科學家加速了研究周期,開辟了全新的研究領域。
麻省理工學院教授 James J. Collins 說:「我們正在探索」。他最近稱贊 AI 的「幻覺」加速了他對新型抗生素的研究進展?!肝覀冏屇P吞岢鐾耆路f的分子。」
科學家向生成式計算機模型輸入特定主題的信息,然后讓機器對主題進行重新加工,從而產生 AI 的「幻覺」。
結果可能有細微的偏差,也可能超越現(xiàn)實。有時,它們會帶來重大發(fā)現(xiàn)。
「幻覺」帶來的諾貝爾化學獎
去年十月,華盛頓大學的 David Baker 因其開創(chuàng)性的蛋白質研究獲得了諾貝爾化學獎。這些復雜的分子是生命活動的關鍵動力。
諾貝爾委員會稱贊他發(fā)現(xiàn)了快速構建完全不同于自然界中蛋白質的新方法,并稱其成就「幾乎不可能」。
在獎項宣布前的一次采訪中,Baker 博士將 AI 的「突發(fā)想象」描述為「從零開始設計蛋白質」的關鍵。
他補充說,這項新技術幫助他的實驗室獲得了約 100 項專利,其中許多用于醫(yī)療用途。一個專利用于一種新的癌癥治療方法,另一個旨在支持全球抗擊病毒感染的工作。他還創(chuàng)辦或協(xié)助創(chuàng)立了超過 20 家生物技術公司。
他說:「發(fā)展速度非???,即使是專門研究蛋白質的科學家,也不了解目前的進展有多大?!?/p>
他的實驗室設計了多少種蛋白質?
他回答道:「一千萬種,而且都是全新的。它們在自然界中并不存在?!?/p>
諾貝爾獎獲得者 Baker 博士對「幻覺」采取了直截了當?shù)膽B(tài)度。
在 2021 年,他在 Nature 上發(fā)表了一篇論文,標題為《通過深度網(wǎng)絡幻覺進行從頭蛋白質設計》(De novo protein design by deep network hallucination)。
論文地址:https://www.nature.com/articles/s41586-021-04184-w
標題中的「從零(De novo)」一詞源自拉丁文,意為「從零開始」,與 1980 年代初科學家開始修改自然界已知蛋白質結構的做法形成了鮮明對比。
2003 年,Baker 博士及其同事實現(xiàn)了一個更宏偉的目標:從零構建世界上第一個全新蛋白質。
他們將其命名為 Top7。這一成就被視為一項重要的突破,因為蛋白質的復雜性堪稱驚人。
專家將 DNA 的結構比作一串珍珠,而將大型蛋白質的結構比作糾結的毛球。即使是詳細的圖示,也只能粗略地表現(xiàn)蛋白質的復雜結構。
在流感病毒表面的血凝素蛋白的棱周圍會形成一種粘合劑蛋白,針對這些易受攻擊的點可以阻止病菌附著在肺部和其他地方的細胞上
隨著 AI 發(fā)展成為一種強大的新技術,Baker 博士開始思考它是否能夠加速從零開始的蛋白質設計。
他在 2021 年的論文中提到,新方法受到了谷歌 DeepDream 模型的啟發(fā)。
DeepDream 模型可以將現(xiàn)有圖像轉化為迷幻風格,創(chuàng)造全新的視覺內容。
當人們看滿月時看到一個人的臉,這被稱為「空想性錯覺」(pareidolia),即一種將模糊圖案轉化為有意義圖像的感知現(xiàn)象。DeepDream 正是利用了這種特性來創(chuàng)造超現(xiàn)實的圖像。
Baker 博士的計劃是測試 AI 是否可以將這種「空想性錯覺」應用于模糊的氨基酸集合 —— 氨基酸是蛋白質的基本構建塊。
他的團隊將隨機的氨基酸序列輸入一個經過訓練的模型,而該模型能識別真實蛋白質的結構特征。
結果大大超出了預期。
論文指出,測試運行生成了數(shù)千種虛擬蛋白質,并將其比作互聯(lián)網(wǎng)中泛濫的貓圖片。
論文寫道:「就像由深度網(wǎng)絡幻覺生成的貓圖像可以清晰地被識別為貓一樣。這些人工蛋白質結構與天然結構相似,但并不完全相同?!?/p>
隨后,貝克團隊嘗試將這些虛擬的蛋白質轉化為現(xiàn)實 —— 這一過程類似于讓電子貓變?yōu)檎鎸嵈嬖诘纳镓?。首先,團隊將這些虛擬分子的結構信息作為藍圖,用以生產形成基因的 DNA 鏈。接著,正如 2021 年的論文所述,當這些基因被插入微生物體內后,這些微生物成功產生了 129 種從未在科學或自然界中發(fā)現(xiàn)的新蛋白質。
2022 年初,Baker 博士將這一成就描述為「AI 加速從零蛋白質設計的首次實證」。
在他于 2022 年和 2023 年發(fā)表的后續(xù)論文中,「幻覺」一詞仍然出現(xiàn)在標題中。
擴散模型帶來蛋白質催化劑
Baker 博士表示,他的實驗室最近在創(chuàng)意生成方面取得了新突破,采用了一種稱為擴散(diffusion)的 AI 方法。這也是 DALL-E 和 Sora 等流行視覺生成器的核心技術。
Baker 博士稱贊擴散技術在設計新蛋白質方面比「幻覺」更高效,他說:「速度更快,成功率也更高?!?/p>
近年來,一些分析人士擔心科學正在走向衰退。他們指出,過去幾十年來,突破性發(fā)現(xiàn)的數(shù)量正在減少。
AI 的支持者則認為,創(chuàng)造性爆發(fā)正在扭轉這一趨勢。
在設計領域,Baker 博士及其同事看到一波波蛋白質催化劑即將誕生。這些催化劑可能幫助收集太陽能、將老舊工廠改造成高效節(jié)能設施,并為構建一個可持續(xù)的新世界提供支持。
Baker 團隊的成員 Ian C. Haydon 認為這種加速仍在繼續(xù)并表示「這令人難以置信。」
「幻覺」是天才的表現(xiàn)
谷歌旗下 AI 公司 DeepMind 科學部負責人 Pushmeet Kohli 在一次采訪中稱贊了「幻覺」在促進科學發(fā)現(xiàn)方面的作用。
不久前,他的兩位同事與 David Baker 博士共同分享了 2024 年的諾貝爾化學獎。
Pushmeet Kohli 表示:「我們擁有一項能夠展現(xiàn)創(chuàng)造力的驚人工具」。
Pushmeet Kohli 博士舉了一個例子,說明了這種工具的創(chuàng)造力。
2016 年,DeepMind 的計算機在圍棋比賽中擊敗了世界冠軍。
這場比賽的轉折點是第 37 步,發(fā)生在比賽的早期階段。
Kohli 博士回憶道:「我們一開始以為那是個錯誤。但隨著比賽的進行,人們意識到那是一種天才的表現(xiàn)。因為,這些模型能夠產生非常新穎的見解?!?/p>
他認同 AI 在加速生物科學的發(fā)展:「接下來的幾年中會出現(xiàn)許多令人驚嘆的成果」。
他認為,AI 正在解鎖生命最深層的奧秘,并為治愈疾病、改善健康和延長壽命奠定了強大的新基礎。
他說:「一旦我們破譯并真正理解生命的語言,那將是奇跡」。
更多的「幻覺」
另一方面,曼哈頓紀念斯隆凱特琳癌癥中心實驗室負責人 Harini Veeraraghavan,在一篇關于利用 AI 改善模糊醫(yī)學圖像的論文中提到了「幻覺」一詞。
這篇論文的標題部分直接寫道「幻覺 MRI」。
論文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC7225573/pdf/nihms-1586979.pdf
得克薩斯大學奧斯汀分校的研究人員也接受了這一術語。他們的一篇論文標題寫道:「從幻覺中學習」,討論如何改進機器人導航。
論文地址:https://www.cs.utexas.edu/~xiao/papers/hallucination.pdf
「幻覺」設計的新事物需要驗證
盡管 AI「幻覺」在科學發(fā)現(xiàn)中的吸引力巨大,但一些科學家認為這一術語具有誤導性。
他們認為,生成式 AI 模型的「想象」并非完全虛幻,而是具有一定實現(xiàn)可能性的,就像科學方法早期階段的假設一樣。因此,他們認為「幻覺」一詞不夠準確,并傾向于避免使用。
此外,「幻覺」一詞還因其與迷幻藥(如 LSD)導致的幻覺聯(lián)想而受到質疑。迷幻藥在過去曾讓許多嚴肅的科學研究裹足不前。
最后,在科學和醫(yī)學交流中,AI 生成的信息可能被錯誤信息所混淆,就像像聊天機器人的回復那樣,這也讓「幻覺」一詞更加備受爭議。
今年七月,白宮發(fā)布了一份關于促進公眾信任 AI 研究的報告,其中唯一提到「幻覺」的部分是關于如何減少它們的存在。
諾貝爾獎委員會似乎也遵循了這一思路。在對 Baker 博士工作的詳細評價中,沒有提及 AI「幻覺」。相反,在新聞稿中,僅稱贊了他的團隊「創(chuàng)造了一種又一種富有想象力的蛋白質」。
科學界的部分機構似乎越來越傾向于將「幻覺」視為一個不宜提及的詞匯。
盡管如此,專家們在紐約時報的采訪中指出,科學 AI 的「想象」相比聊天機器人等的「幻覺」具有顯著優(yōu)勢。
最根本的一點是,這種創(chuàng)造性爆發(fā)基于自然和科學的硬性事實,而非人類語言的歧義或互聯(lián)網(wǎng)中的偏見和虛假信息。
「幻覺」并不可靠
加州理工學院的數(shù)學與計算機科學教授 Anima Anandkumar 表示:「我們正在教授 AI 物理學」。她曾擔任 AI 芯片領先制造商英偉達的 AI 研究主管。
Anandkumar 博士補充說,對于科學而言,基于可靠事實的物理學基礎可以帶來高度準確的結果。
她指出,聊天機器人的大語言模型無法實際驗證其陳述和斷言的正確性。
她強調,最終的驗證來自科學家將這些 AI 生成的構想與物理現(xiàn)實的具體細節(jié)進行比較。
她談到 AI 的成果時說道:「你需要對其進行測試,AI 靠『幻覺』設計的新事物需要經過驗證。」
最近,Anandkumar 博士及其同事利用 AI 的「幻覺」幫助設計了一種全新的導管。
這種導管可以顯著減少細菌污染 —— 這一全球性問題每年導致數(shù)百萬例尿路感染。
她表示,團隊的 AI 模型設計了數(shù)千種導管幾何形狀,并最終選出其中最有效的一種。
這種新導管的內壁上覆蓋著鋸齒狀突起,能夠防止細菌附著并向上游移動,從而感染患者的膀胱。Anandkumar 博士提到,該團隊正在討論這種設備的商業(yè)化。
與其他科學家一樣,Anandkumar 博士表示她不喜歡「幻覺」這個術語。
她的團隊在關于新導管的論文中避免使用該詞。
「幻覺」是概率分布?
Amy McGovern 博士是 AI 研究所的負責人,也是俄克拉荷馬大學氣象學和計算機科學的教授。
她認為 AI 的「幻覺」或許更適合被稱為「概率分布」—— 這是科學領域一個傳統(tǒng)的術語。
她補充道,天氣研究人員現(xiàn)在經常使用 AI 來創(chuàng)建數(shù)千種細微的預測變化或概率范圍。這些豐富的想象幫助他們發(fā)現(xiàn)了可能引發(fā)極端事件(如致命熱浪)的意外因素。
她認為這是一種非常有價值的工具。
參考資料:
https://www.nytimes.com/2024/12/23/science/ai-hallucinations-science.html#:~:text=The%20A.I.,they%20lead%20to%20major%20discoveries.
本文來自微信公眾號:新智元(ID:AI_era)
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。