2023 年人工智能指數(shù)報(bào)告發(fā)布了!這份報(bào)告顯示,中國(guó)在 AI 頂會(huì)論文上表現(xiàn)世界居首,然而引用量卻低于美國(guó)。另外,AI 論文發(fā)表量世界前十的機(jī)構(gòu)中,中國(guó)占了 9 席,紛紛趕超 MIT。
今天,斯坦福發(fā)布了 2023 年 AI 指數(shù)報(bào)告。
值得注意的是,斯坦福 AI 指數(shù)報(bào)告列出了「AI 論文發(fā)表量」世界前十的機(jī)構(gòu),9 所全部來(lái)自中國(guó),紛紛趕超 MIT。
它們分別是:中國(guó)科學(xué)院、清華大學(xué)、中國(guó)科學(xué)院大學(xué)、上海交通大學(xué)、浙江大學(xué)、哈爾濱工業(yè)大學(xué)、北京航空航天大學(xué)、電子科技大學(xué)、北京大學(xué)、以及 MIT。
今年的報(bào)告主要分為八大節(jié):研究與發(fā)展,技術(shù)表現(xiàn),人工智能技術(shù)倫理,經(jīng)濟(jì),教育,政策和治理,多樣性,以及公眾觀點(diǎn)。
以下內(nèi)容提取了報(bào)告幾項(xiàng)要點(diǎn)。
中美論文合作全球居首
從 2010 年-2021 年,盡管 AI 論文跨國(guó)合作的步伐已經(jīng)放緩,但是自 2010 年以來(lái),美國(guó)和中國(guó)的人工智能研究合作數(shù)量增加了大約 4 倍,比中國(guó)和英國(guó)合作總數(shù)多 2.5 倍。
然而,從 2020 年-2021 年,中美合作的總數(shù)僅增長(zhǎng)了 2.1%,是自 2010 年以來(lái)的最小同比增長(zhǎng)率。
此外,人工智能論文的總數(shù)自 2010 年以來(lái)翻了一番以上。從 2010 年的 20 萬(wàn)篇增長(zhǎng)到 2021 年的近 50 萬(wàn)篇(49601)。
就 AI 論文發(fā)表的類型來(lái)看,2021 年,所有已發(fā)表的 AI 論文中有 60% 是期刊文章,17% 是會(huì)議論文,13% 來(lái)自存儲(chǔ)庫(kù)。
雖然在過(guò)去 12 年中期刊和儲(chǔ)存庫(kù)論文分別增長(zhǎng)了 3 倍和 26.6 倍,但會(huì)議論文的數(shù)量自 2019 年以來(lái)有所下降。
模式識(shí)別、機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)依舊是人工智能領(lǐng)域研究的熱門(mén)話題。
中國(guó)在期刊、會(huì)議和儲(chǔ)存庫(kù)論文總量方面依舊處于領(lǐng)先地位。
美國(guó)在人工智能會(huì)議和儲(chǔ)存庫(kù)引用方面仍然領(lǐng)先,但這些領(lǐng)先優(yōu)勢(shì)正被慢慢削弱。盡管如此,世界上大多數(shù)的大型語(yǔ)言模型和多模態(tài)模型(2022 年 54%)是由美國(guó)機(jī)構(gòu)產(chǎn)生的。
中國(guó)霸榜 AI 頂會(huì),但引用量低于美國(guó)
AI 期刊論文的發(fā)表,中國(guó)始終保持領(lǐng)先地位,2021 年為 39.8%,其次是歐盟和英國(guó)(15.1%),然后是美國(guó)(10.0%)。
自 2010 年以來(lái),中國(guó)人工智能期刊論文被引頻次占比逐步上升,歐盟、英國(guó)、美國(guó)均有所下降。中國(guó)、歐盟和英國(guó)、美國(guó)占全球總引用量的 65.7%。
那么,世界頂會(huì)論文發(fā)表的情況又如何?
2021 年,中國(guó)以 26.15% 的比例在全球 AI 頂會(huì)發(fā)表的論文數(shù)所占份額最大,而歐盟和英國(guó)以 20.29% 緊隨其后,美國(guó)以 17.23% 位居第三。
從頂會(huì)論文引用量來(lái)看,中國(guó)雖然高產(chǎn),但引用量相較于美國(guó)來(lái)說(shuō)較低。美國(guó)頂會(huì)論文引用量 23.9%,中國(guó)為 22.02%。
從側(cè)面可以看出,中國(guó)論文發(fā)表數(shù)量最多,但質(zhì)量不如美國(guó)高。
在 AI 論文儲(chǔ)存庫(kù)提交方面,美國(guó)在世界居首,23.48%。中國(guó)最低,11.87%。
中國(guó) 9 所機(jī)構(gòu),AI 論文發(fā)表趕超 MIT
2021 年,發(fā)表論文總量世界前十機(jī)構(gòu)中,中國(guó)占了 9 所,不同機(jī)構(gòu)發(fā)表的論文總數(shù)如下圖,MIT 位列第十,發(fā)表論文 1745。
就計(jì)算機(jī)視覺(jué)領(lǐng)域(CV)來(lái)看,中國(guó)的十所機(jī)構(gòu)位居世界前十,它們分別是,中國(guó)科學(xué)院、上海交通大學(xué)、中國(guó)科學(xué)院大學(xué)、清華大學(xué)、浙江大學(xué)、北京航空航天大學(xué)、武漢大學(xué)、北京理工大學(xué)、哈爾濱工業(yè)大學(xué),以及天津大學(xué)。
在自然語(yǔ)言處理(NLP)領(lǐng)域,就有所不同了。
世界前十的機(jī)構(gòu) / 公司有:中國(guó)科學(xué)院、卡內(nèi)基梅隆大學(xué)、微軟、清華大學(xué)、卡內(nèi)基梅隆大學(xué)-澳大利亞分校、谷歌、北京大學(xué)、中國(guó)科學(xué)院大學(xué)、阿里、亞馬遜。
語(yǔ)音識(shí)別領(lǐng)域排名如下:
工業(yè)界領(lǐng)先學(xué)術(shù)界
在 2022 年發(fā)布的重要人工智能機(jī)器學(xué)習(xí)系統(tǒng)中,語(yǔ)言系統(tǒng)占最多,有 23 個(gè),是多模態(tài)系統(tǒng)數(shù)量的 6 倍。
在論文產(chǎn)量上,工業(yè)界領(lǐng)先于學(xué)術(shù)界。
直到 2014 年,大多數(shù)重要的模型都是由學(xué)術(shù)界發(fā)布的。從那時(shí)起,工業(yè)界便逆襲翻身。到 2022 年,32 個(gè)重要的機(jī)器學(xué)習(xí)模型都誕生在工業(yè)界,而學(xué)術(shù)界僅有 3 個(gè)。
由此可見(jiàn),與非營(yíng)利組織和學(xué)術(shù)界相比,構(gòu)建最先進(jìn)的人工智能系統(tǒng)越來(lái)越需要大量的數(shù)據(jù)、計(jì)算機(jī)能力和資金資源,而行業(yè)參與者固然有更多的資金資源去做這件事情。
2022 年,美國(guó)產(chǎn)生了數(shù)量最多的重要機(jī)器學(xué)習(xí)系統(tǒng),有 16 個(gè),其次是英國(guó)(8 個(gè))和中國(guó)(3 個(gè))。
此外,自 2002 年以來(lái),就創(chuàng)建的重要機(jī)器學(xué)習(xí)系統(tǒng)總數(shù)而言,美國(guó)已經(jīng)超過(guò)了英國(guó)和歐盟、中國(guó)
再來(lái)看做出這些重要 AI 系統(tǒng)背后研究者國(guó)分布,美國(guó)有最多的研究者,285 人,是英國(guó)的 2 倍多,是中國(guó)的近 6 倍。
LLM 越來(lái)越大,算力越貴
大型語(yǔ)言和多模態(tài)模型,有時(shí)稱為基礎(chǔ)模型,是當(dāng)前一種新興且日益流行的 AI 模型類型,它在大量數(shù)據(jù)上進(jìn)行訓(xùn)練并適用于各種下游應(yīng)用程序。
ChatGPT、DALL-E 2 和 MakeA-Video 等大型語(yǔ)言和多模態(tài)模型已經(jīng)展示了令人印象深刻的功能,并開(kāi)始在現(xiàn)實(shí)世界中廣泛部署。
通過(guò)對(duì)這些模型作者的國(guó)家隸屬關(guān)系進(jìn)行了分析,這些研究人員中的大多數(shù)來(lái)自美國(guó)機(jī)構(gòu)(54.2%)。
斯坦福 AI 指數(shù)報(bào)告還列出了大型語(yǔ)言和多模態(tài)模型發(fā)布的時(shí)間表。
大型語(yǔ)言模型正變得越來(lái)越大,也越來(lái)越昂貴。
第一個(gè)大型語(yǔ)言模型 GPT-2 于 2019 年發(fā)布,有 15 億參數(shù),訓(xùn)練成本約 50000 美元。谷歌 PaLM 是 2022 年推出的大型語(yǔ)言模型之一,有 5400 億參數(shù),成本高達(dá) 800 萬(wàn)美元。
從參數(shù)和訓(xùn)練成本來(lái)看,PalM 比 GPT-2 大 360 倍,成本高出 160 倍。
不僅僅是 PalM,從整體上看,大型語(yǔ)言和多模態(tài)模型變得越來(lái)越大和昂貴。
例如,DeepMind 于 2022 年 5 月推出的大型語(yǔ)言模型 Chinchilla 估計(jì)耗資 210 萬(wàn)美元,而 BLOOM 的訓(xùn)練大約耗資 230 萬(wàn)美元。
隨著時(shí)間的推移,GAN 在人臉生成方面的進(jìn)展,最后一個(gè)圖像由 Diffusion-GAN 生成,這一模型在 STL-10 上取得了最新的 SOTA。
去年,隨著 OpenAI 的 DALL-E 2、Stability AI 的 Stable Diffusion、Midjourney、Meta 的 Make-AScene,以及谷歌的 Imagen 等模型的發(fā)布,文本到圖像生成模型逐漸走進(jìn)大眾視野。
如下,輸入相同的提示,「一只熊貓?jiān)跍嘏陌屠枰雇韽椾撉佟?,分別由 DALL-E 2、Stable Diffusion 和 Midjourney 這三個(gè)可公開(kāi)訪問(wèn)的 AI 文本到圖像系統(tǒng)生成的圖像。
在最近發(fā)布的所有文本到圖像生成模型中,谷歌的 Imagen 在 COCO 基準(zhǔn)測(cè)試中表現(xiàn)最好。
今年,創(chuàng)建 Imagen 的谷歌研究人員還發(fā)布了一個(gè)更難的文本到圖像基準(zhǔn)測(cè)試 DrawBench,旨在挑戰(zhàn)功能越來(lái)越強(qiáng)大的文本到圖像模型。
此外,報(bào)告還介紹了當(dāng)前生成式 AI 模型存在一些偏見(jiàn),比如給 DELLE-2 提示 CEO 時(shí),每個(gè)人似乎都采取了交叉雙臂自信的姿勢(shì)。
在 Midjourney 中,當(dāng)提示生成「有影響力的人」時(shí),它會(huì)生成 4 張看起來(lái)年長(zhǎng)的白人男性圖像。
完整報(bào)告內(nèi)容請(qǐng)參見(jiàn):
https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index_Report_2023.pdf
本文來(lái)自微信公眾號(hào):新智元 (ID:AI_era)
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。