設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

AI 預(yù)測蝴蝶效應(yīng)?谷歌最新天氣預(yù)報模型 SEEDS 登 Science 子刊

新智元 2024/5/1 14:47:15 責編:遠洋

  新智元報道  

編輯:Mindy

【新智元導(dǎo)讀】天氣本質(zhì)上是隨機的,為了量化不確定性,傳統(tǒng)方法通常需要高昂的成本來物理模擬大量預(yù)測。谷歌最新研究登 Science 子刊,用生成式 AI 模型高效生成規(guī)?;奶鞖忸A(yù)報集合,為天氣和氣候科學(xué)開辟了新的機會。

1972 年 12 月,在美國華盛頓特區(qū)舉行的美國科學(xué)促進會年會上,麻省理工學(xué)院氣象學(xué)教授埃德?洛倫茲發(fā)表了題為「巴西一只蝴蝶的扇動是否會在得克薩斯引發(fā)龍卷風?」的演講,這貢獻了「蝴蝶效應(yīng)」這一術(shù)語。

在他 1963 年的一篇論文中,他發(fā)現(xiàn)在時間積分與數(shù)值天氣預(yù)測模型里,即使微小的起始條件誤差,也會在數(shù)值模型中迅速擴大,導(dǎo)致預(yù)測結(jié)果的不確定性迅速增加,這被稱為混沌現(xiàn)象。

因此,天氣預(yù)報的可靠性受到了限制,尤其是在極端天氣事件的預(yù)測方面,比如颶風、熱浪或洪水。

出于上述原因,目前的天氣預(yù)報其實都是概率預(yù)報。

這些預(yù)報使用了一種叫做集合預(yù)報的方法,通過在初始條件中引入一些隨機性,然后運行多個不同的模型來生成多種可能的結(jié)果。

通過對集合中的所有預(yù)報進行平均處理來減少誤差增長,并且集合中的預(yù)報的變化量量化了天氣條件的不確定性。

盡管有效,生成這些概率預(yù)報的計算成本很高。它們需要在大規(guī)模超級計算機上多次運行高度復(fù)雜的數(shù)值天氣模型。

尤其是極端天氣,通常需要更大的集合來評估。例如,為了預(yù)測發(fā)生概率為 1% 的事件的可能性,需要一個包含 1 萬個成員的集合,且相對誤差小于 10%。

但準確和及時的天氣預(yù)報,是人們?nèi)粘I钏匦璧?。從準備一天的活動需要帶什么出門,到面對危險天氣的時候要提前做什么準備。

谷歌最新研究給天氣預(yù)報帶來了一個新的進展:Scalable Ensemble Envelope Diffusion Sampler(SEEDS)是一個生成式的 AI 模型,可以高效地生成規(guī)?;奶鞖忸A(yù)報集合,成本僅為傳統(tǒng)基于物理的預(yù)測模型的一小部分。

這項技術(shù)為天氣和氣候科學(xué)開辟了新的機遇,它同時也代表了概率擴散模型在天氣和氣候預(yù)測中的首次應(yīng)用。

生成式 AI 準確生成天氣預(yù)報集合

在上述論文中,谷歌提出了可擴展的集合包絡(luò)擴散采樣器(SEEDS),這是一種用于天氣預(yù)報集合生成的生成式人工智能技術(shù)。

SEEDS 基于去噪擴散概率模型,這是一種由 Google Research 部分開創(chuàng)的最先進的生成式人工智能方法。

生成式人工智能以生成非常詳細的圖像和視頻而聞名,這一特性對于生成與真實天氣模式一致的集合預(yù)報特別有用。

SEEDS 可以根據(jù)操作性數(shù)值天氣預(yù)報系統(tǒng)中的一兩個預(yù)報來生成大量的集合。

生成的集合在技能指標上與基于物理的集合相匹配或超過,比如均方根誤差(RMSE)和連續(xù)排名概率評分(CRPS)等;不僅如此,還為預(yù)報分布的尾部(如 ±2σ 和 ±3σ 天氣事件)分配了更準確的可能性。

傳統(tǒng)物理方法和 SEEDS 的生成對比

最重要的是,與需要數(shù)小時計算時間的超級計算機相比,該模型的計算成本幾乎可以忽略不計。在 Google Cloud TPUv3-32 實例上,其吞吐量為每 3 分鐘 256 個集合成員(分辨率為 2°),并且可以通過部署更多加速器輕松擴展到更高的吞吐量。

下圖對比了 SEEDS 與操作性美國天氣預(yù)報系統(tǒng)(全球集合預(yù)報系統(tǒng),GEFS)在 2022 年歐洲熱浪期間某個特定日期的預(yù)報結(jié)果。

其中 A 是真實觀測的代理,(Ca-Ch)是 SEEDS 模擬出來的 8 個樣本,而(Da-Dh)是來自 GEFS 的預(yù)報。雖然肉眼可能很難直接看出明顯的區(qū)別,但 SEEDS 更能捕捉到交叉場和空間相關(guān)性,這會與真實的天氣更加貼近。

這是因為 SEEDS 直接模擬了大氣狀態(tài)的聯(lián)合分布,它實際上捕捉了大氣狀態(tài)的空間協(xié)方差和中對流層高度和平均海平面氣壓之間的相關(guān)性,這兩者常被氣象學(xué)家用于預(yù)報評估和驗證。(一些專業(yè)的解釋:平均海平面氣壓的梯度驅(qū)動著地表的風,而中對流層高度的梯度則產(chǎn)生了移動大尺度天氣模式的高層風。)

更準確地覆蓋極端事件

SEEDS 集合能夠從一兩個種子預(yù)報中外推,展示了可能的天氣狀態(tài)的范圍,對事件的統(tǒng)計覆蓋更好。

也就是說,高度可擴展的生成方法能夠創(chuàng)建非常大的集合,可以通過任何不同狀態(tài)閾值設(shè)置的天氣樣本,來描述非常罕見的事件。

比如說下圖展示了 2022 年 7 月 14 日當?shù)貢r間 1:00 在里斯本附近發(fā)生的極端高溫事件的 2 米溫度和總柱水汽的聯(lián)合分布。

對于每個圖,谷歌研究團隊使用 SEEDS 根據(jù) 2 個物理模型的種子預(yù)報,生成了 16384 個成員的集合,顯示為綠色點。

正確天氣事件來自 ERA5,用星號表示。

用方塊表示用于傳統(tǒng)方法生成集合的預(yù)報,用三角形表示剩余的傳統(tǒng)方法集合成員。

可以看到藍色方塊和黃色三角形根本不接近星號,也就是說,傳統(tǒng)方式根本不可能提前觀察到這種極端情況,其 31 個成員中沒有一個預(yù)測到與觀察到的那樣溫暖的近地表溫度。

實際上,從高斯核密度估計中計算的事件概率低于 1%,這意味著少于 100 個成員的集合不太可能包含與此事件一樣極端的預(yù)報。

而 SEEDS 生成的綠色點,卻可以提供更好的統(tǒng)計覆蓋,基于它精準的生成能力和高效的生成速度。

天氣預(yù)報新模式?

上述實驗展示了一種混合預(yù)報系統(tǒng),SEEDS 利用基于物理模型計算出的少數(shù)幾條天氣軌跡來更有效地生成更多預(yù)報的擴散模型。

這種方法提供了一種替代當前操作性天氣預(yù)報范式的方法。

同時,通過統(tǒng)計模擬器節(jié)省的計算資源可以用于提高基于物理模型的分辨率或更頻繁地發(fā)布預(yù)報。

這或許是天氣預(yù)報的未來新模式,也可能 SEEDS 僅代表了未來幾年 AI 將加速操作性數(shù)值天氣預(yù)報進展的眾多方式之一。

但谷歌研究展現(xiàn)出來的是生成式人工智能在天氣預(yù)報模擬和后處理中的實用性,對于準確量化未來氣候的不確定性和氣候風險評估,提供了一個新的方向。

參考資料:

  • https://blog.research.google/2024/03/generative-ai-to-quantify-uncertainty.html

本文來自微信公眾號:新智元 (ID:AI_era)

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:人工智能AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知