可令 AI 模型計(jì)算復(fù)雜離散數(shù)學(xué)問(wèn)題,谷歌 DeepMind 公布“FunSearch”訓(xùn)練法

2023/12/15 17:14:33 來(lái)源:IT之家 作者:漾仔(實(shí)習(xí)) 責(zé)編:漾仔

IT之家 12 月 15 日消息,谷歌 DeepMind 日前公布了一種名為“FunSearch”的模型訓(xùn)練法,號(hào)稱(chēng)能夠計(jì)算包含“上限級(jí)問(wèn)題”、“裝箱問(wèn)題”在內(nèi)的一系列“涉及數(shù)學(xué)、計(jì)算機(jī)科學(xué)領(lǐng)域的復(fù)雜問(wèn)題”。

▲ 圖源 谷歌 DeepMind(下同)

據(jù)悉,F(xiàn)unSearch 模型訓(xùn)練法主要為 AI 模型引入了一個(gè)“評(píng)估器(Evaluator)”系統(tǒng),AI 模型輸出一系列“創(chuàng)意解題方法”,“評(píng)估器”則負(fù)責(zé)評(píng)判模型輸出的解題辦法,反復(fù)迭代后,就能訓(xùn)練出數(shù)學(xué)能力更強(qiáng)的 AI 模型。

谷歌 DeepMind 使用 PaLM 2 模型進(jìn)行測(cè)試,研究人員建立了專(zhuān)用“代碼池”,使用代碼形式為模型輸入一系列問(wèn)題,并設(shè)置了評(píng)估器流程,之后模型便會(huì)在每一次迭代中,自動(dòng)從代碼池中挑選問(wèn)題,生成“具有創(chuàng)造性的新解法”,并交由評(píng)估器進(jìn)行評(píng)估,其中“最佳解法”將會(huì)被重新加入到代碼池中,重新開(kāi)始另一次迭代。

IT之家注意到,FunSearch 訓(xùn)練法對(duì)“離散數(shù)學(xué)(Combinatorics)”特別擅長(zhǎng),經(jīng)訓(xùn)練法鍛煉后的模型,可以輕松解決極值組合數(shù)學(xué)問(wèn)題,研究人員在新聞稿中便介紹了模型計(jì)算“上限級(jí)問(wèn)題(數(shù)學(xué)中涉及計(jì)數(shù)和排列領(lǐng)域的一個(gè)中心問(wèn)題)”的過(guò)程方法。

此外,研究人員也成功使用 FunSearch 訓(xùn)練法解決了“裝箱問(wèn)題(Bin Packing Problem)”,這是一個(gè)“將不同大小物品放進(jìn)最少數(shù)量容器”的問(wèn)題,F(xiàn)unSearch 為“裝箱問(wèn)題”提供了一種“即時(shí)性”的解決方案,生成一項(xiàng)“根據(jù)物品現(xiàn)有體積自動(dòng)進(jìn)行調(diào)整”的程序。

研究人員提到,與其他利用神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)的 AI 訓(xùn)練法相比,經(jīng)過(guò) FunSearch 訓(xùn)練法鍛煉后的模型,輸出的代碼更易于檢查與部署,也就代表更容易被整合到實(shí)際工業(yè)環(huán)境中。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:谷歌AI,DeepMind,離散數(shù)學(xué)

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知