DeepMind 近日公布了 AlphaFold 的最新進展:已預(yù)測出超過 100 萬個物種的 2.14 億個蛋白質(zhì)結(jié)構(gòu),幾乎涵蓋了地球上所有已知蛋白質(zhì),再次刷新了我們對它的期待。
AlphaFold 2 橫空出世時的熱烈場景重現(xiàn),再次在國內(nèi)外的社交媒體上引發(fā)熱議。但作為“圈內(nèi)人”的生命科學(xué)領(lǐng)域研究者們,對 AlphaFold 此次公布的成果卻褒貶不一。
此前潘毅、周耀旗、許東等幾位生物信息學(xué)領(lǐng)域的學(xué)者曾表示:AlphaFold 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫此次更新的海量數(shù)據(jù)中存在著部分結(jié)果結(jié)構(gòu)不穩(wěn)定、不能應(yīng)用于研究中等問題。
加拿大蒙特利爾大學(xué) MILA 實驗室唐建教授也向醫(yī)健 AI 掘金志表示,AlphaFold 預(yù)測出的蛋白質(zhì)對藥物研發(fā)的影響有限。
近期,美國一位制藥行業(yè)的資深專家 Derek Lowe 博士發(fā)文,對外界尤其是媒體熱捧的 AlphaFold 進行了一番吐槽。
Derek Lowe 博士畢業(yè)于杜克大學(xué),在大型制藥公司工作了三十余年,從事治療精神分裂癥、阿爾茨海默氏癥、糖尿病、骨質(zhì)疏松癥和其他疾病的藥物發(fā)現(xiàn)項目。
▲ Derek Lowe
上周,Derek Lowe 在英國皇家化學(xué)學(xué)會 (Royal Society of Chemistry)的網(wǎng)站上發(fā)布了一篇文章。他旗幟鮮明地指出:AlphaFold 不會帶來藥物研發(fā)領(lǐng)域的革新。
以下為 Derek Lowe 的文章,雷峰網(wǎng)做了不改變原意的整理。
長期以來,蛋白質(zhì)結(jié)構(gòu)預(yù)測一直被認(rèn)為是計算生物學(xué)中最困難的問題之一。
但是在過去的一兩年中,AlphaFold 在這方面的工作上取得了顯著的進步,預(yù)測出絕大部分人體蛋白質(zhì)的組織結(jié)構(gòu)。
如果放在十年前,這樣的成果就像科幻故事一樣。
我并不想否認(rèn) AlphaFold 取得的成果,但是一些新聞報道錯誤地理解了 AlphaFold 這一成果的意義。
我們并沒有在理解“蛋白質(zhì)為什么會這樣折疊”方面取得巨大飛躍。蛋白質(zhì)結(jié)構(gòu)通常情況下以線圈、環(huán)或片狀的形態(tài)存在,但為什么不繼續(xù)深入其中進行研究?
如果只在目前的層面上進行研究,將無法發(fā)現(xiàn)許多隱秘的答案。
我們早就擁有成千上萬的新蛋白質(zhì)結(jié)構(gòu)預(yù)測結(jié)果,絕大部分是正確的。而且,盡管有一些例外,它們似乎確實大部分是正確的。
AlphaFold 的算法在面對無序的蛋白質(zhì)區(qū)域時會無法正常工作,AlphaFold 的整個計算技術(shù)都建立在尋找已知結(jié)構(gòu)的類比上,在沒有可比較結(jié)構(gòu)的情況下,AlphaFold 也無計可施。
一部分無序的蛋白質(zhì)在各種蛋白質(zhì)的影響下能夠進行有序排列,但也有一部分蛋白質(zhì)在任何條件下都從未出現(xiàn)過有序的結(jié)構(gòu)。
當(dāng)?shù)鞍踪|(zhì)無法形成有序結(jié)構(gòu)的時候,就超出了 AlphaFold 的計算能力。
▼ AlphaFold 提供了其結(jié)構(gòu)預(yù)測的置信度。深藍(lán)色結(jié)構(gòu)的置信度更高,而黃色和橙色結(jié)構(gòu)的置信度較低
需要強調(diào)的是,通過 AlphaFold,我們得到的是蛋白質(zhì)結(jié)構(gòu)的預(yù)測,而非真正的蛋白質(zhì)結(jié)構(gòu)。
AlphaFold 是很實用的蛋白質(zhì)預(yù)測方法,但通過 X 射線、核磁共振或冷凍電鏡等方式獲取蛋白質(zhì)的實際數(shù)據(jù),才是確定其準(zhǔn)確性的唯一方法。
但由于構(gòu)象的靈活性,即使是實際數(shù)據(jù)也無法完全代表其準(zhǔn)確性。這正是媒體報道中夸大 AlphaFold 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫對藥物研發(fā)影響的地方。
在小分子配體的存在下,蛋白質(zhì)結(jié)構(gòu)會發(fā)生變化和滑動,有時細(xì)微有時劇烈,但 AlphaFold 還無法預(yù)測這些變化。
也許最終能夠找到這些問題的算法解決方案,但到目前為止,還沒有足夠多能夠與小分子配體結(jié)合蛋白結(jié)構(gòu)。我們需要的數(shù)量非常多。
有大約 20 種不同的蛋白質(zhì)側(cè)鏈需要考慮,但小分子結(jié)構(gòu)的數(shù)量如此巨大,相比之下幾乎是無限的。
還有一點,聽起來很刺耳(盡管這是真的):在藥物研發(fā)的過程中,對蛋白質(zhì)結(jié)構(gòu)的了解,鮮少影響研發(fā)進度。
因為研究者們通常在使用純蛋白或活細(xì)胞進行檢測的基礎(chǔ)上運行項目。檢測數(shù)據(jù)則代表著化合物是否符合研究者的要求,以及是否隨著新化合物制造而表現(xiàn)更好。
蛋白質(zhì)的結(jié)構(gòu)可能會對研究者們下一步制造什么化合物有所啟發(fā),但也可能沒有任何幫助。
歸根結(jié)底,來自真實生物系統(tǒng)的真實數(shù)字才是最重要的。隨著藥物研發(fā)項目的進行,這些數(shù)字涵蓋了藥代動力學(xué)、新陳代謝和毒理學(xué)的檢測,這些都無法真正從蛋白質(zhì)結(jié)構(gòu)水平上處理。
激流之后往往才是最終的瀑布。
新藥在最后的臨床環(huán)節(jié)失敗,往往是因為我們選擇了錯誤的靶點或其他難以預(yù)料的原因。而蛋白質(zhì)結(jié)構(gòu)預(yù)測對減輕這兩種風(fēng)險都無濟于事,這就是藥物研發(fā)的臨床失敗率高達 85% 的原因。
蛋白質(zhì)結(jié)構(gòu)預(yù)測的確是一個非常棘手的問題,但藥物研發(fā)中面臨的風(fēng)險明顯難度更甚。
Derek Lowe 這篇文章發(fā)布后,也引發(fā)了兩派讀者的討論。
支持他的讀者認(rèn)為,在研究中的確應(yīng)該考慮到柔性蛋白質(zhì)的影響,因為構(gòu)象狀態(tài)的變化需要逐案理解。蛋白質(zhì)-蛋白質(zhì)和蛋白質(zhì)-核酸相互作用對了解該系統(tǒng)也很重要。結(jié)構(gòu)本身無法解決所有問題,在取代實驗數(shù)據(jù)之前,人工智能還有一段路要走。
也有讀者不同意 Derek Lowe 的觀點,認(rèn)為“良好的結(jié)構(gòu)預(yù)測將大大加快獲取經(jīng)驗數(shù)據(jù)集的過程?!?/p>
一位讀者表示,“基于結(jié)構(gòu)的設(shè)計將是一個限制因素 —— 在一個難以獲得結(jié)構(gòu)的環(huán)境中。在一個有 AlphaFold 的世界中,情況不再如此。此外,可以再次運行 AlphaFold,將一個小分子放入并重新折疊它周圍的蛋白質(zhì)。20 年前,在我攻讀博士學(xué)位期間,我們曾經(jīng)使用 sybyl 和 autodock 來做同樣的事情 —— 坦率地說,這些軟件工具完全是垃圾。傳統(tǒng)的藥物設(shè)計就像盲人拄著拐杖一樣顫顫巍巍,通過基于結(jié)構(gòu)的設(shè)計,我們現(xiàn)在可以看到。它(AlphaFold)以前不是藥物設(shè)計的重要組成部分,這一事實與未來如何發(fā)現(xiàn)新藥無關(guān)?!?/p>
有讀者認(rèn)為,基于結(jié)構(gòu)的藥物設(shè)計活動大大有助于降低失敗率。在 AlphaFold 缺乏實驗結(jié)構(gòu)的情況下與分子動力學(xué)模擬等其他計算方法相結(jié)合,遠(yuǎn)比傳統(tǒng)方法要好得多。
不論國內(nèi)還是國外,學(xué)者們對 AlphaFold 的評價均是褒貶不一,對其在藥物研發(fā)中將產(chǎn)生的影響看法也不盡相同。
Derek Lowe 的這篇文章,代表的是主流或者傳統(tǒng)藥企技術(shù)專家,面對新技術(shù)時一種“本能性”的抵觸。
這種現(xiàn)象,和醫(yī)學(xué)影像 AI 出現(xiàn)時,醫(yī)生對 AI 的吐槽并無區(qū)別,本質(zhì)上是兩種專業(yè)背景的碰撞和對抗。但是,現(xiàn)在的放射科醫(yī)生也逐漸接受了 AI 幫他們找肺結(jié)節(jié)。
得到這個問題的答案也很簡單,從什么角度對 AlphaFold 所代表的深度學(xué)習(xí)技術(shù)進行價值評估?
AlphaFold 能否為藥物研發(fā)領(lǐng)域帶來革新性的變化,你會站在哪一邊?
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。