最新消息,阿里大模型元老楊紅霞入職香港理工大學(xué),任電子計算機系教授。
楊紅霞是 AI 領(lǐng)域知名科學(xué)家。她曾在 IBM T.J.沃森研究中心擔任研究人員,并在雅虎擔任首席科學(xué)家。2016 年加入阿里巴巴,就職于達摩院智能計算實驗室;2023 年 3 月入職字節(jié)跳動。
她在達摩院期間領(lǐng)導(dǎo)了通義千問前身 M6 大模型的研發(fā),是 M6 大模型從百億、千億參數(shù)量進化到萬億規(guī)模的主要功臣,并領(lǐng)導(dǎo)通義大模型核心技術(shù)“統(tǒng)一學(xué)習(xí)范式 OFA-M6”的開發(fā)。
任職字節(jié)期間,她主要負責大模型研發(fā),向字節(jié) AML 和豆包大模型 Foundation 團隊負責人項亮匯報。
今年 5 月,楊紅霞被曝從字節(jié)跳動離職,有傳聞稱她將進行大模型領(lǐng)域創(chuàng)業(yè)。如今,更先一步曝光了她進軍學(xué)術(shù)圈的消息。此前楊紅霞未曾在高校內(nèi)有正式任職,僅擔任過浙江大學(xué)上海高級研究院兼職教授。
通義千問奠基人物
楊紅霞本科畢業(yè)于南開大學(xué)統(tǒng)計學(xué)專業(yè)。博士就讀于杜克大學(xué)。在頂級會議和期刊上發(fā)表論文 100 余篇,在美國和中國擁有 50 多項專利。主要研究方向為貝葉斯統(tǒng)計、時間序列分析、時空建模、生存分析、機器學(xué)習(xí)、數(shù)據(jù)挖掘及其在商業(yè)分析和大數(shù)據(jù)中的應(yīng)用。
博士畢業(yè)后,她最先在 IBM T.J.沃森研究中心擔任研究人員。之后來到雅虎擔任計算廣告首席數(shù)據(jù)科學(xué)家,負責開發(fā)廣告投放預(yù)測相關(guān)算法。
2016 年,楊紅霞回國入職阿里巴巴,就職于達摩院智能計算實驗室。在此期間她最重要的工作是推動了 M6 大模型的研發(fā)和擴展。這一多模態(tài)模型是通義千問的前身,也是構(gòu)建阿里當下大模型競爭力的關(guān)鍵基礎(chǔ)工作。
M6 項目在啟動研發(fā) 1 年時間左右,快速完成從億級到十萬億級規(guī)模擴展。2020 年 6 月項目啟動,2021 年 5 月發(fā)布萬億參數(shù)規(guī)模 M6 并投入使用,2021 年 10 月 M6 正式成為全球首個 10 萬億參數(shù)多模態(tài)大模型。
不僅成為當時世界上最大的中文多模態(tài)模型,并且快速追趕上谷歌的發(fā)展腳步,在文生圖、商業(yè)化等領(lǐng)域達到世界一流水平。而且在綠色低碳方面,相比 GPT-3,M6 實現(xiàn)了同等參數(shù)規(guī)模下所需能耗僅為 1%。
這項工作由阿里和清華共同開發(fā),楊紅霞、唐杰共同擔任通訊作者。
其他主要成員,正是通義千問研發(fā)的核心成員,比如 An Yang、Rui Men。M6 的共同一作林俊旸是目前通義千問開源負責人。
2022 年 9 月,達摩院正式發(fā)布“通義”大模型系列,打造業(yè)界首個 AI 通義底座,并構(gòu)建了大小模型協(xié)同的層次化人工智能系統(tǒng)。其中統(tǒng)一底座的 M6-OFA 模型由楊紅霞領(lǐng)導(dǎo)完成。它在業(yè)界首次實現(xiàn)模態(tài)表示、任務(wù)表示、模型結(jié)構(gòu)統(tǒng)一。不引入新增結(jié)構(gòu),單一模型就可以同時處理超過 10 項跨模態(tài)任務(wù),升級后可以處理超過 30 種。這項工作對外開源,目前被引用數(shù)超過 900+,GitHub 星標 2.4k。
而就在這項重磅發(fā)布 1 個月后,楊紅霞被曝因家庭原因從達摩院離職。
下一次新動向已是 2023 年 3 月。消息稱她已加入字節(jié) AML(機器學(xué)習(xí)系統(tǒng))團隊,任字節(jié)跳動大語言模型研發(fā)技術(shù)專家,在美國西雅圖從事大語言模型的研發(fā)。
不過短短 1 年時間,她就又從字節(jié)離職。與此同時,行業(yè)的風(fēng)向也從基礎(chǔ)大模型開發(fā),逐漸轉(zhuǎn)向更細分的應(yīng)用落地方向。
同步籌備全球化 AI 項目
值得一提的是,此前楊紅霞的下一站被猜測是“端側(cè)模型創(chuàng)業(yè)”,布局 AI Agent。5 月消息稱,團隊正在籌備組建中,已獲得 3000-4000 萬美元投資,投后估值 1.5 億美元。
最近量子位從知情人士處獲悉,楊紅霞前不久還在西雅圖籌備全球化 AI 項目。綜合來看,楊紅霞入職香港理工大學(xué),可能和創(chuàng)業(yè)動作并不沖突。
值得一提的是,從事更具體的 AI 細分領(lǐng)域大展拳腳,確實是目前 AI 人才再創(chuàng)業(yè)比較集中的選擇。比如漆遠的創(chuàng)業(yè)方向選擇了可信大模型。從螞蟻集團副總裁任上離職后,漆遠先是重返學(xué)界,在復(fù)旦擔任教職,而后又產(chǎn)學(xué)研并行地創(chuàng)立了大模型公司無限光年。
此前,量子位從市場獲悉更多消息如下:
如上或有缺漏與誤傳,歡迎評論區(qū)留言指正、分享更多行業(yè)信息。
參考鏈接:
https://www.polyu.edu.hk/comp/people/academic-staff/prof-yang-hongxia/
本文來自微信公眾號:量子位(ID:QbitAI),作者:明敏
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。