設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

OpenAI 當(dāng)紅新星宋飏:最新研究獲評(píng)「終結(jié)擴(kuò)散模型」,16 歲上清華

量子位 2023/4/17 12:11:14 責(zé)編:夢(mèng)澤

一個(gè) OpenAI 華人大牛,最近引發(fā)眾人關(guān)注。

他剛以一作身份發(fā)表的最新生成模型,引爆整個(gè)學(xué)術(shù)圈,讓不少人驚呼:

有望「終結(jié)擴(kuò)散模型」,「圖像生成領(lǐng)域,要變天了」。

他提出的一致性模型,效果比擴(kuò)散模型更快更好 —— 只需 3.5 秒就能生成 64 張左右 256×256 的圖像。

而在此之前,同樣也是因?yàn)樗墓ぷ?,才有了之?strong>擴(kuò)散模型的狂潮 ——

DALL-E 2、Stable Diffusion、Imagen 等的出現(xiàn)。

這位名叫宋飏的機(jī)器學(xué)習(xí)研究員,親身參與著圖像生成領(lǐng)域的關(guān)鍵性變革。

但不為多數(shù)人所知的是,他曾 16 歲裸分上清華,原本是想當(dāng)一名物理學(xué)家。

他曾這樣形容兩者之間的關(guān)系:

有很多技術(shù)最初是由物理學(xué)家發(fā)明的,現(xiàn)在在機(jī)器學(xué)習(xí)中非常重要。

OpenAI 華人大牛

從個(gè)人網(wǎng)站上顯示,目前他在 OpenAI 致力于開發(fā)可擴(kuò)展的方法來(lái)建模、分析和生成復(fù)雜的高維數(shù)據(jù)。

主要研究興趣涵蓋多個(gè)領(lǐng)域,包括生成建模、表示學(xué)習(xí)、概率推理、人工智能安全性以及 AI for Science。

而他的最終目標(biāo)也在網(wǎng)站上提及:

解決具有廣泛意義的問(wèn)題,開發(fā)既易于理解又有效的方法,并構(gòu)建可以改善人類生活的智能系統(tǒng)。

他的最新論文一致性模型,在學(xué)術(shù)圈引起了巨大的反響。

有網(wǎng)友實(shí)測(cè)發(fā)現(xiàn),只需要 3.5 秒左右就能生成 64 張左右 256×256 的圖像:

游戲結(jié)束!

這種圖像生成領(lǐng)域的顛覆性,對(duì)于宋飏本人來(lái)說(shuō)可能并不陌生。

來(lái)到 OpenAI 之前,他曾在斯坦福大學(xué)攻讀計(jì)算機(jī)博士,研究包括基于分?jǐn)?shù)的生成模型(Score-Based Diffusion models)和擴(kuò)散模型,師從 Stefano Ermon。

Stefano Ermon 是斯坦福計(jì)算機(jī)系副教授,隸屬于人工智能實(shí)驗(yàn)室,也是伍茲環(huán)境研究所的研究員。

(值得一提的是,OpenAI 不少研究員也師出同門,比如負(fù)責(zé) ChatGPT 訓(xùn)練的 Shengjia Zhao,本科同樣畢業(yè)于清華)

其團(tuán)隊(duì)連續(xù)兩年獲得 ICLR 杰出論文獎(jiǎng),其中一次一作正是宋飏。

使用隨機(jī)微分方程進(jìn)行基于分?jǐn)?shù)的生成建模。

他們提出了一種全新的方式來(lái)解決基于分?jǐn)?shù)生成模型的逆向問(wèn)題,最終在 CIFAR-10 上實(shí)現(xiàn)了破紀(jì)錄的無(wú)條件圖像生成性能,并首次在這種生成模型中證明了高分辨率(1024?1024)圖像的高保真生成。

而要被視作為 Diffusion Model 提供早期貢獻(xiàn)的,還要屬被 NeurIPS 2019 接收并做口頭報(bào)告的工作。

當(dāng)時(shí),GAN 還在以逼真生成風(fēng)格席卷全球,但眾多科學(xué)家仍受困于很難訓(xùn)練、無(wú)法完整采樣等難題。

斯坦福大學(xué)博士后 Sohl-Dickstein 受到物理學(xué)啟發(fā),利用擴(kuò)散原理開發(fā)了生成建模算法 —— 類似于從一滴墨水變成漫射淡藍(lán)色的水,首先將訓(xùn)練數(shù)據(jù)集中的復(fù)雜圖像轉(zhuǎn)化為簡(jiǎn)單的噪聲,然后教系統(tǒng)如何反轉(zhuǎn)這個(gè)過(guò)程,將噪聲轉(zhuǎn)化為圖像。

雖然可以對(duì)整個(gè)分布進(jìn)行采樣,但性能效果仍遠(yuǎn)遠(yuǎn)落后于 GAN,訓(xùn)練過(guò)程也太慢。

這時(shí)候,宋飏和他的導(dǎo)師出現(xiàn)了。他們提出了一種新方法,不估計(jì)數(shù)據(jù)的概率分布,而是估計(jì)分布的梯度,最終效果實(shí)現(xiàn)了對(duì) GAN 的超越。

宋飏坦言:當(dāng)時(shí)根本不知道擴(kuò)散模型。是在論文發(fā)表之后,收到了 Sohl-Dickstein 的郵件,稱與擴(kuò)散模型有非常緊密的聯(lián)系。

此后,更多人在此基礎(chǔ)上進(jìn)行了更新和迭代,才有了擴(kuò)散模型的驚艷效果。

或許在此之前,宋飏怎么也不會(huì)想到,這場(chǎng) Diffusion Model 風(fēng)潮竟受到物理啟發(fā),還會(huì)與自己有關(guān)。

16 歲就當(dāng)理科狀元上清華

早在高中的時(shí)候,宋飏就展現(xiàn)了他在物理和信息學(xué)方面的天賦。

當(dāng)時(shí)他在江蘇省新海高級(jí)中學(xué),就獲得了全國(guó)物理奧賽、信息學(xué)奧賽的一等獎(jiǎng),并且還成功當(dāng)選第一年清華大學(xué)“新百年領(lǐng)軍計(jì)劃”校長(zhǎng)推薦人。

據(jù)稱,這放在連云港市,也是全市第一人。

圖源:學(xué)校官網(wǎng)

當(dāng)時(shí)清華推薦生面試現(xiàn)場(chǎng),一段“樸實(shí)無(wú)華”的自我介紹就讓當(dāng)場(chǎng)所有人都記住了他。

我是奧賽宋飏,我獲得了物理以及信息學(xué)的全國(guó)一等獎(jiǎng);我是標(biāo)兵宋飏,我的理想是做一名物理學(xué)家,現(xiàn)在我已經(jīng)自學(xué)了高校里的高等數(shù)學(xué)以及普通物理學(xué);我還是文藝宋飏,我已經(jīng)通過(guò)了鋼琴十級(jí)考試,在班級(jí)的羽毛球?qū)官惿?,也有我活躍的身影。

最終全票通過(guò),當(dāng)上了清華推薦生。但他有一個(gè) flag:裸分上清華

于是在第二年,以 425 分獲得當(dāng)年連云港市的理科狀元,順利進(jìn)入到了清華大學(xué)數(shù)理基礎(chǔ)科學(xué)班,師從朱軍、Raquel Urtasun、Richard Zemel 等大佬。

對(duì)于這個(gè)成績(jī),當(dāng)時(shí)他也沒有想到:我覺得也就在 400 分左右吧,完全出乎意料。

據(jù)當(dāng)時(shí)揚(yáng)子晚報(bào)消息,每次考完試時(shí),就經(jīng)常找老師們聊天談心。在學(xué)校里考得最差的一次是年級(jí) 40 多名。

除了學(xué)校和老師的幫助,家庭的氛圍也對(duì)他的成長(zhǎng)密不可分。年幼時(shí)父母晚飯后就不看電視,而是各自拿著一本書在看。在這種氛圍中,宋飏也坐在書桌旁閱讀各類書籍。

現(xiàn)在,他也有了最新動(dòng)向:

2024 年 1 月開始,他將加入加州理工學(xué)院電子系(EE)和計(jì)算數(shù)學(xué)科學(xué)系(CMS)擔(dān)任助理教授。

參考鏈接:

  • [1]http://www.xhgz.com/show-10-783-1.html

  • [2]https://news.sina.com.cn/o/2012-06-25/052524649267.shtml

  • [3]https://baike.sogou.com/v63765572.htm

  • [4]https://yang-song.net/

  • [5]https://tieba.baidu.com/p/1279964102

  • [6]https://www.quantamagazine.org/the-physics-principle-that-inspired-modern-ai-art-20230105/

本文來(lái)自微信公眾號(hào):量子位 (ID:QbitAI),作者:楊凈

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:OpenAI

軟媒旗下網(wǎng)站: IT之家 最會(huì)買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買 要知