設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

中國工程院院士鄔賀銓:大模型純粹對話聊天絕對不是剛需,很難形成商業(yè)模式

2023/12/21 16:47:47 來源:新浪科技 作者:- 責(zé)編:汪淼

12 月 21 日下午消息,由新浪財經(jīng)客戶端、新浪科技聯(lián)合主辦的“2023 科技風(fēng)云榜”年度盛典今日開幕,今年活動主題為“智涌?進(jìn)躍”。中國工程院院士鄔賀銓發(fā)表題為《大模型上手,數(shù)智化進(jìn)階》的演講。

鄔賀銓表示,人工智能的發(fā)展使得互聯(lián)網(wǎng)迅速地進(jìn)入了智能化的時代。一年前 ChatGPT 給大家眼睛一亮,當(dāng)然 ChatGPT 還是一個基礎(chǔ)大模型,仍然還是第二代人工智能,我們希望將來是通用的,希望至少在三個方面:第一,一個模型不能僅僅對一個任務(wù),能夠適應(yīng)多任務(wù)。第二,不能只限于一種模態(tài)輸入,希望多模態(tài)輸入。第三,在將來推理能夠非常精準(zhǔn)。

他認(rèn)為,大模型的出現(xiàn)會給我們工業(yè)上的數(shù)字化轉(zhuǎn)型和高質(zhì)量發(fā)展帶來很好的技術(shù)支撐?,F(xiàn)在難題還是,我們做基礎(chǔ)大模型,怎么能夠跟我們行業(yè)更緊密地結(jié)合。“我已經(jīng)注意到,國內(nèi)做大模型的幾個有名的單位,他們雖然有一些提供語料的對話,聊天,實際上純粹對話聊天絕對不是剛需,也很難形成一個商業(yè)模式?!?/p>

除了在工業(yè)上的應(yīng)用場景,鄔賀銓還舉例,現(xiàn)在把大模型做到了手機(jī)上,手機(jī)已經(jīng)可以訓(xùn)練超過 100 億參數(shù)的,作為推理運用,目前已經(jīng)有人做到 130 億參數(shù)了。估計到明年 150 億也可能做進(jìn)手機(jī)里。這種大模型落地會催生新一輪創(chuàng)新,會降低用戶生成三維視頻門檻。我們很多年前手機(jī)一般一年半就換代了,這幾年換代沒有這個需求。將來起來了,更多的實際推廣是靠用戶產(chǎn)生內(nèi)容,大模型落到手機(jī)上,可以為用戶產(chǎn)生內(nèi)容提高一個檔次。我們不但是消費,還有健康、養(yǎng)老、監(jiān)護(hù)、教育,最有價值的還是工業(yè)應(yīng)用,你可以落在手機(jī)上,也可以落在機(jī)器人,工業(yè)模組上面,這些可以帶來新的飛躍。

他援引 IDC 預(yù)測數(shù)據(jù)稱,到 2026 年中國市場超過 50% 終端設(shè)備處理器會有 AI 引擎,會讓中國互聯(lián)網(wǎng)產(chǎn)業(yè)走出低谷,會迎來一次激動人心的井噴式發(fā)展。

以下為演講實錄:

各位專家、各位領(lǐng)導(dǎo),大家下午好,我的發(fā)言題目是大模型上手,數(shù)智化進(jìn)階。明年 4 月份中國要迎來成功進(jìn)入互聯(lián)網(wǎng) 30 周年,我們可以回顧一下 30 年來發(fā)生了非常大的變化,中國互聯(lián)網(wǎng)進(jìn)入而立之年。

一個發(fā)現(xiàn),我們整個互聯(lián)網(wǎng)移動化發(fā)展很快,特別是 4G 帶動了移動互聯(lián)網(wǎng)的迅速普及,現(xiàn)在 5G 帶動工業(yè)互聯(lián)網(wǎng)的發(fā)展。

互聯(lián)網(wǎng)從最初的面向一般消費客戶的點到點的連接,現(xiàn)在變成了一個平臺,從點上平臺,云平臺,社交平臺,直播平臺,產(chǎn)業(yè)平臺,尤其是近幾年,我們?nèi)斯ぶ悄艿陌l(fā)展使得互聯(lián)網(wǎng)迅速地進(jìn)入了智能化的時代。

剛才談到了大模型,實際上 60 多年前就有人工智能的研究,1956 年的時候,那時候是學(xué)界里面的,沒有多少人知道。為大家所知道的是 1997 年 IBM 深藍(lán)計算機(jī)戰(zhàn)勝了國際象棋大師,過了一段大家也沒有什么感覺了,2016 年阿爾法戰(zhàn)勝圍棋高手,發(fā)現(xiàn)人類下棋下不過計算機(jī)了。

下棋這些還不是剛需,對社會生活也沒有太多影響。去年年底,一年前 ChatGPT 給大家眼睛一亮,當(dāng)然 ChatGPT 還是一個基礎(chǔ)大模型,仍然還是第二代人工智能,我們希望將來是通用的,希望至少在三個方面:

  • 第一,一個模型不能僅僅對一個任務(wù),能夠適應(yīng)多任務(wù)。

  • 第二,不能只限于一種模態(tài)輸入,希望多模態(tài)輸入。

  • 第三,在將來推理能夠非常精準(zhǔn)。

大模型也有很多層,也有很多節(jié)點,我們開始在對應(yīng)某一個任務(wù),并不知道應(yīng)該走哪個路徑是最準(zhǔn)確的,但是可以通過大規(guī)模的訓(xùn)練,反復(fù)迭代,試錯來可以知道哪一個節(jié)點,應(yīng)該經(jīng)過的全值概率是多少,這些就是參數(shù)。顯然參數(shù)越多,分解得越精細(xì)。我現(xiàn)在來看,從 2018 年 ChatGPT1 到今年年初的 ChatGPT4,參數(shù)已經(jīng)增加了一萬倍,當(dāng)然對應(yīng)的訓(xùn)練數(shù)據(jù)和調(diào)用 GPU 卡數(shù)也相應(yīng)地增加。

現(xiàn)在講大模型,剛才對話嘉賓也講到了,我們中國有 188 個大模型,這些大模型基本上都是互聯(lián)網(wǎng)公司,還有 IT 企業(yè)來研發(fā)的,這種基礎(chǔ)大模型門檻還是比較高的,現(xiàn)在垂直行業(yè)的企業(yè)還很少,大企業(yè)自己做大模型,做基礎(chǔ)大模型,剛才林院長說的,它沒有辦法用到工業(yè)上,基本的語料不是工業(yè)預(yù)料,工業(yè)上數(shù)據(jù)也沒有那么多,想找這么大量數(shù)據(jù)訓(xùn)練也不容易。在節(jié)點上基礎(chǔ)大模型還落不了地,要落地怎么辦呢?必須跟行業(yè)合作,行業(yè)合作有兩種辦法,一種是把企業(yè)的數(shù)據(jù)送到基礎(chǔ)大模型提供方,然后讓他們幫助把行業(yè)數(shù)據(jù)加進(jìn)去進(jìn)行微調(diào),這種企業(yè)會擔(dān)心,我的數(shù)據(jù)送出去會不會泄密。技術(shù)上要完全依賴于基礎(chǔ)大模型。

還有一種辦法把基礎(chǔ)大模型訓(xùn)練好的模型給企業(yè),企業(yè)自己加上自己的數(shù)據(jù)微調(diào),這里面對企業(yè)技術(shù)水平要求比較高,另外基礎(chǔ)訓(xùn)練的時候是一個老師教的,到企業(yè)訓(xùn)練的時候是另外一個老師,這兩個老師會不會教起來有不一致的地方,那可能最后沒有辦法收了。

要跟行業(yè)合作還是有難題的,對于大多數(shù)中小企業(yè)更是了,本身就更很難接入大模型,我們希望能不能把大模型變成一個簡約的模塊,放在云平臺 PAAS 和 SAAS 之間,這樣一來我們就可以通過一個簡單的接口,企業(yè)可以接入到這個模型模塊里面。我們還要相應(yīng)的配置一些低代碼的開發(fā)軟件,可以通過鼠標(biāo)拖拉,為企業(yè)基礎(chǔ)場景接入和微調(diào)提供機(jī)會。真做到了這一點,我們將來就可以做到企業(yè)會上云,就會用這個模型了。我把中小企業(yè),通過這種方法來做模型,我稱之為場景的大模型,他還是針對特定應(yīng)用的。

大模型的出現(xiàn)會給我們工業(yè)上的數(shù)字化轉(zhuǎn)型和高質(zhì)量發(fā)展帶來很好的技術(shù)支撐?,F(xiàn)在難題還是,我們做基礎(chǔ)大模型方,怎么能夠跟我們行業(yè)更緊密地結(jié)合,我已經(jīng)注意到,國內(nèi)做大模型的幾個有名的單位,他們雖然有一些提供語料的對話,聊天,實際上純粹對話聊天絕對不是剛需,也很難形成一個商業(yè)模式。國內(nèi)做一些大模型的單位,都瞄準(zhǔn)了做工業(yè),比如說百度要跟吉利合作做智能客服,跟國家電網(wǎng)合作,做分布式電網(wǎng)調(diào)度。百度還做 MLA 疫苗序列有效分析,在新冠疫情期間,中國大量使用的是滅活疫苗,美國是使用 MLA,這有很多序列,其中也不是所有序列都對新冠有效,要找出最好的序列,這還是有難度的。據(jù)說超算一秒鐘算一條要算一百億年,現(xiàn)在利用大模型可以優(yōu)選出比較好的疫苗,當(dāng)然不見得是最佳了,這個百度曾經(jīng)發(fā)表在雜志上,也得到了認(rèn)可。我認(rèn)為從這些方面介入,這些方面都還沒有直接進(jìn)入到制造業(yè)生產(chǎn)線上。

華為盤古大模型主要針對制造業(yè),他瞄準(zhǔn)制造業(yè)里面需求的理解,文檔的生成,工業(yè)軟件的編程,讀圖,以及我們供應(yīng)鏈管理,也可以看到這些也是在生產(chǎn)線的外圍,真正在產(chǎn)業(yè)的核心部分還是沒有進(jìn)去。

騰訊有一個微搭低代碼平臺,著重面向中小網(wǎng)站,做網(wǎng)站的開發(fā)等等。

阿里有一個通義千問,訓(xùn)練參數(shù)也不少,可以支持 8K 向上文窗口,他可以做聊天對話,你輸入的長度也反映了大模型能力。阿里可以輸入 8K 左右。

針對制造業(yè)領(lǐng)域做大模型的是海爾,他本身是制造業(yè),通過海爾本身家用電器的生產(chǎn),他基本上掌握了家用電器里面的生產(chǎn)流程。海爾大模型在家用電器行業(yè)里面沒有推廣,為什么呢?其他都是他競爭對手,海爾大模型反而推廣到服裝行業(yè),汽車行業(yè),推廣到這些地方去了。

有了大模型,有初級人工智能發(fā)展,也給社會上更多的中小企業(yè)機(jī)會。這時候出來了一批面向更多中小企業(yè)的平臺企業(yè)。比如說廣州有一個企業(yè)做服裝設(shè)計的建模,服裝工廠的管理。大量的服裝廠只有一大批縫紉女工,沒有什么技術(shù)的,引入了廣州致景軟件,使生產(chǎn)管理上了一個很好的臺階。

山東的橙色云,這本來是一個設(shè)計工具軟件出租公司,很多企業(yè)用工具軟件,自己買太貴了,用時候也不多,用租,以租的辦法可以省錢。后來城市運營發(fā)展成為設(shè)計承接和轉(zhuǎn)包平臺,很多企業(yè)在那里發(fā)布一些需求,他把設(shè)計需求分解了,之后招標(biāo),最后把完成的結(jié)果通過它集成,現(xiàn)在已經(jīng)面向五萬多家中小企業(yè)了。

深圳有一個云工科技,有一些企業(yè)需要訂貨,需要一些產(chǎn)品,不知道在哪訂,在哪里發(fā)布。還有很多企業(yè)就在這上面應(yīng)標(biāo),半年能夠撮合 100 億的交易。

廣州有一個公司,主要是做女裝出口,他利用珠三角的服裝加工的能力,國際快速的物流能力,從品牌,設(shè)計,面料、采購、銷售、金融、保險等等一條龍,現(xiàn)在是世界上 54 個國家手機(jī)購物里面最重要一個環(huán)節(jié),他即將上市,估值要超千億美元。江蘇有一個智云天工,這是一個虛擬工廠,三一重工是供應(yīng)鏈管理平臺,三一重工作為龍頭,把供應(yīng)鏈 200 多家上下游企業(yè)關(guān)聯(lián)起來,最重要做到零庫存或者說少庫存,大大提升了效率。

現(xiàn)在談大模型大部分在大智算中心,超算上面做?,F(xiàn)在一個新的出來了,把大模型做到手機(jī)上,現(xiàn)在手機(jī)已經(jīng)可以訓(xùn)練超過 100 億參數(shù)的,作為推理運用,目前已經(jīng)有人做到 130 億參數(shù)了。估計到明年 150 億也可能做進(jìn)手機(jī)里。

有人說只有超過 130 億的參數(shù),在手機(jī)上做有什么好處,將來大模型訓(xùn)練可以離線,這樣成本低,不需要上智算,超算中心,時延也低?,F(xiàn)在美國有一個公司,Aizip,要把大模型做到手機(jī)上需要做一些模型壓縮工作,手機(jī)芯片還要提檔。做模型壓縮工作要量化壓縮,要重新做一下。這個公司說從大模型可以復(fù)制出小模型,可以落到手機(jī)上。

同聲傳譯,我們打電話對方是老外,他講英文我這邊聽是中文,如果是視頻,還可以幫助你對口型。我們可以跟聾啞人,手語對話,盲文翻譯。歌曲創(chuàng)作,你哼幾段話,后來給你續(xù)譜。

搜索,過去要很精準(zhǔn),現(xiàn)在用不著精準(zhǔn),一個模糊的話也能夠把你希望想搜什么搞出來。當(dāng)然你將來可以手機(jī)、平板、PC、電視互通。

給出一句話,一個 32 歲年輕女性自然保護(hù)者在叢林中探險,面帶親切的微笑,給你生出這個照片。中間的照片只拍了一點點,現(xiàn)在延伸了,可能你只有半身照,現(xiàn)在可能變成全身照。

我們現(xiàn)在手機(jī)有前拍有后拍,現(xiàn)在可以同時用上,把你前拍的照片嵌入到后面去,當(dāng)然還要光線調(diào)整,這是自拍的合成。

這種大模型落地會催生新一輪創(chuàng)新,會降低用戶生成三維視頻門檻。我們很多年前手機(jī)一般一年半就換代了,這幾年換代沒有這個需求。將來起來了,更多的實際推廣是靠用戶產(chǎn)生內(nèi)容,大模型落到手機(jī)上,可以為用戶產(chǎn)生內(nèi)容提高一個檔次。我們不但是消費,還有健康、養(yǎng)老、監(jiān)護(hù)、教育,最有價值的還是工業(yè)應(yīng)用,你可以落在手機(jī)上,也可以落在機(jī)器人,工業(yè)模組上面,這些可以帶來新的飛躍。

IDC 預(yù)測到 2026 年中國市場超過 50% 終端設(shè)備處理器會有 AI 引擎,我們認(rèn)為會讓中國互聯(lián)網(wǎng)產(chǎn)業(yè)走出低谷,會迎來一次激動人心的井噴式發(fā)展。

數(shù)智經(jīng)濟(jì)講了很多,實際上未來我們大模型為數(shù)字經(jīng)濟(jì)增添了新的能力,我這里回顧了 90 年代全球市值最高的前十名,主要是日本的銀行,2000 年主要都是紅色的是美國的 IT 企業(yè),2010 年是能源,金融,2020 年又回到互聯(lián)網(wǎng)主導(dǎo)了,中國的阿里、騰訊也在上面,到今年 12 月份,現(xiàn)在可以看到,除了有食藥公司以外,基本上還是 IT 和 IC 企業(yè),我們說現(xiàn)在位居前列的是以數(shù)智化企業(yè)為主,是數(shù)據(jù)成為主要的生產(chǎn)要素。

謝謝大家。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:鄔賀銓,大模型

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會買 要知