【新智元導(dǎo)讀】讓 AI 負(fù)責(zé)實驗操作,科學(xué)家負(fù)責(zé)思考。
人工智能以及自主實驗?zāi)壳爸饕?Python 等語言編寫,但并非所有實驗科學(xué)工作者都擅長這類編程語言,在真實世界實驗中的影響力還是比較有限。
不過,基于 OpenAI 最近發(fā)布的 ChatGPT API 函數(shù)調(diào)用功能 [1],現(xiàn)有的技術(shù)已經(jīng)足夠支撐打造一個曾經(jīng)只能在鋼鐵俠電影中看到的賈維斯智能助手。
近日,MIT 李巨教授組開發(fā)了一個實驗科學(xué)家的人工智能助手 CRESt(Copilot for Real-world Experimental Scientist),其后端是用 ChatGPT 作為核心串聯(lián)起:
1. 真實世界的機(jī)械臂進(jìn)行自動化實驗
2. 本地或網(wǎng)上專業(yè)的材料數(shù)據(jù)庫
3. 優(yōu)化材料配方的主動學(xué)習(xí)算法
視頻地址:https://youtu.be/ POPPVtGueb0
目前 CRESt 的前端已經(jīng)實現(xiàn)了 voice-in voice-out,AI 生成語音,以及多平臺無縫切換。
有了 CRESt 之后,即使沒有任何代碼經(jīng)驗,科研工作者都能通過與其口頭對話來利用自動化實驗平臺幫自己做實驗。
論文鏈接:https://doi.org/ 10.26434 / chemrxiv-2023-tnz1x
項目介紹
「CRESt 操作系統(tǒng)」主要由四部分組成:用戶界面,ChatGPT 后端,主動學(xué)習(xí)和末端執(zhí)行器。
其中用戶界面基于一個支持語音轉(zhuǎn)文本和文本轉(zhuǎn)語音交互的 Github 項目 chatgpt-voice [2]。其便捷的網(wǎng)絡(luò)框架使得用戶可以在離開實驗室后在他們的手機(jī)上無縫地繼續(xù)對話。
并且后端是獨立運行的,即使前端改變也不會受到影響。
此外,作者還將可以實時生成非常逼真的人聲的 ElevenLabs AI 語音集成到了前端中 [3]
從前端收到的文本消息隨后將被傳輸?shù)浇⒃?CallingGPT 基礎(chǔ)之上的 ChatGPT 后端。
CallingGPT 是另一個 Github 項目,其能將 Google docstring 樣式記錄的 Python 函數(shù)轉(zhuǎn)換成 ChatGPT API 可以識別的 JSON 格式,以供在 ChatGPT 認(rèn)為需要時調(diào)用。
此外,它在 ChatGPT 和本地 Python 函數(shù)庫之間閉合了一個反饋回路:ChatGPT 所建議調(diào)用的函數(shù)將立即在本地執(zhí)行,并且其返回值將被發(fā)送回 ChatGPT。
除此之外,作者還在 CRESt 中嵌入了主動學(xué)習(xí)算法,得益于在小數(shù)據(jù)集上不錯的性能,主動學(xué)習(xí)被認(rèn)為是最適合實驗科學(xué)的機(jī)器學(xué)習(xí)算法之一 [5-7]。
在涉及真實物理世界實驗的機(jī)器學(xué)習(xí)項目中,數(shù)據(jù)采集往往是最大的挑戰(zhàn)。
與虛擬世界不同,真實物理世界中的每一個數(shù)據(jù)點可能都需要花費大量的時間和金錢。
一般來說,1000 個點的數(shù)據(jù)集就已經(jīng)是相當(dāng)不錯的了,在這樣的條件下,如何對設(shè)計空間進(jìn)行高效取樣變得至關(guān)重要。
主動學(xué)習(xí)的主要功能是交互式地建議在下一批實驗中測試的參數(shù)組合,比如在視頻中展示的合金配方推薦。
在 CRESt 中內(nèi)嵌的是由 Meta 團(tuán)隊開發(fā)的基于 BoTorch 的 Ax 平臺 [8, 9],Ax 有著優(yōu)秀的 SQL 存儲功能:即使 GPT 后端重置,也可以通過調(diào)取數(shù)據(jù)庫中存儲的記錄來繼續(xù)之前的主動學(xué)習(xí)。
末端執(zhí)行器是一系列通過 HTTP 請求調(diào)用的子程序。其中一些可能涉及信息檢索任務(wù)(本地或公共數(shù)據(jù)庫查詢,如 Materials Project [10]),而其他一些可能會對物理世界產(chǎn)生真實的影響,就像在視頻中展示的那樣(液體處理機(jī)器人、激光切割機(jī)、泵、氣閥、機(jī)械臂等),主要是用于做實驗的一些自動化的硬件。
這些設(shè)備的自動化主要由 PyAutoGUI 實現(xiàn),一個可以模擬人類鼠標(biāo)和鍵盤動作的 Python 庫 [11]。
然而,作者預(yù)期這個冗余步驟最終將失去其必要性,因為在不久的將來大多數(shù)實驗室設(shè)備都應(yīng)該會在人類交互界面之外提供一個專用的 AI 通信接口。
展望
大語言模型可以為科學(xué)和工程領(lǐng)域帶來什么?
這是作者團(tuán)隊自 ChatGPT 問世以來一直在思考的問題。毫無疑問,大語言模型已經(jīng)展示了其作為文獻(xiàn)整理員的超凡潛力,我們需要做的只是在預(yù)訓(xùn)練過程中向其提供更多的文獻(xiàn)全文。
除此之外還有哪些可能性呢?除了我們以 CRESt 形式開發(fā)的實驗員助手的角色,我們設(shè)想大語言模型至少還會在以下三個維度發(fā)揮革命性的作用:
儀器技術(shù)指導(dǎo)員
目前,研究人員必須理解他們希望利用的任何技術(shù)的理論基礎(chǔ),以及個別儀器的具體操作(有時是基于經(jīng)驗的“技巧”、“手藝”),而這些操作可能會因制造商而異。
后者往往意味著不可忽視的時間成本,例如一個公共儀器的一系列培訓(xùn)課程,或者閱讀一個組內(nèi)儀器的 200 頁說明書,以及上百小時的實操練習(xí)。
但我們冷靜下來思考一下,這些步驟真的是必要的嗎?
我們預(yù)見,在不久的將來,研究人員只需要清楚地用自然語言表達(dá)他們的需求,大語言模型就能夠?qū)⑦@些需求翻譯成最佳的參數(shù)設(shè)置(其實這就是現(xiàn)在一些儀器專家正在做的事情,了解客戶的需求,并轉(zhuǎn)化成儀器參數(shù)設(shè)定 / 操作)。
當(dāng)必要時,大語言模型也可以將說明書中的對應(yīng)部分提供給用戶以便用戶了解詳情。
從技術(shù)上來說,儀器制造商只需要適當(dāng)?shù)匚⒄{(diào)一個大語言基礎(chǔ)模型,讓其學(xué)習(xí)公司內(nèi)高級技術(shù)員所掌握的儀器操作經(jīng)驗即可,這件事從今天就能開始做。
流水線診斷師
結(jié)合了多傳感器的機(jī)器人或無人機(jī)后,大語言模型可以幫助確定實驗可重復(fù)性不佳的根本原因。
在未來,最理想的實驗范式是記錄每個樣品整個生命周期中的所有元數(shù)據(jù)。當(dāng)出現(xiàn)無法解釋的現(xiàn)象時,所有相關(guān)的日志數(shù)據(jù)都將被輸入到多模態(tài)大語言模型進(jìn)行分析。
利用其優(yōu)秀的假說生成能力,大語言模型可以提出一系列潛在的原因,以供人類專家進(jìn)一步調(diào)查他們認(rèn)為最有可能的幾個假說。
這種方法也可以應(yīng)用于工業(yè)流水線 —— 如果注意到生產(chǎn)產(chǎn)量 / 良品率大幅下降,大語言模型可以通過對比流水線歷史記錄來識別「罪魁禍?zhǔn)住埂?/p>
只有需要復(fù)雜的現(xiàn)實世界操作時,人類工程師才需要介入,除此以外大語言模型可以直接對大概率出了問題的子環(huán)節(jié)進(jìn)行參數(shù)微調(diào)。
實現(xiàn)這個角色的前提條件是大語言模型可以處理大量的圖像(視頻),且其性能取決于多模態(tài)信息(樣品元數(shù)據(jù),視覺信息,聲音信息等)的對齊程度。
機(jī)理猜想者
我們預(yù)期大語言模型十分擅長將已建立的科學(xué)原理用于解釋新的實驗現(xiàn)象。科學(xué)機(jī)理探索階段的很大一部分工作都是模式匹配型工作(例如,從光譜中提取微小的特征并與標(biāo)準(zhǔn)數(shù)據(jù)庫進(jìn)行比較),這些都在大語言模型的能力范圍內(nèi)。
在不久的將來,這個工作流將會變的非常簡單直接,我們只需要問大語言模型:我們制備并測試了一個樣品,它的成分是 xxx,處理工藝和參數(shù)是 xxx,其性能是 xxx。
這是所有的表征結(jié)果(掃描電子顯微鏡,X 射線衍射等),請給出 10 個理由詳細(xì)表述為什么這個樣品的性能這么好。
人類研究者可以從大語言模型生成的一系列敘述中篩選出最合理的解釋,并以此為基礎(chǔ)完善整個機(jī)理解釋。
然而,這個任務(wù)是所有我們預(yù)想的大語言模型的角色中最具有挑戰(zhàn)性的,其實現(xiàn)的前提條件包括:
1. 圖像輸入和與科學(xué)術(shù)語的對齊,
2. 從專業(yè)物理科學(xué)數(shù)據(jù)庫中檢索特定信息的能力,
3. 大語言模型在科學(xué)期刊正文和附錄的預(yù)訓(xùn)練,
4. 大語言模型有能力調(diào)用一系列前沿的子領(lǐng)域的機(jī)器學(xué)習(xí)模型或是仿真模型。
總結(jié)
CRESt 只是大語言模型協(xié)助科學(xué)家的一個起點,我們相信大語言模型的真正潛力在于其假說生成能力 [12]。
人類擁有相對有限的知識庫,但出色的因果推理能力使得我們能夠給出雖然數(shù)量不多但一針見血的假說。
相比之下,人工智能有著廣泛的知識庫以及從大數(shù)據(jù)中提取統(tǒng)計信息的能力 [13],因此它們可以在短時間內(nèi)生成大量的,沒那么精準(zhǔn)的假說。
因此,這不是一個人工智能與人類競爭的故事,而是人工智能補(bǔ)足人類短板的故事。
在「AI suggests, humans select」的合作模式下,雙方都能發(fā)揮出各自的優(yōu)勢,「各盡其才」。
參考資料:
https://doi.org/10.26434/chemrxiv-2023-tnz1x
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。