
人工智能和機器學習改變天氣預報的速度遠超人們的預期。過去需要運行數小時的數值天氣預報(NWP)模型,現在已經有了機器學習天氣預報(MLWP)模型的加入,可以在幾分鐘內生成全球預報。然而,在人工智能預報時代,觀測數據的重要性反而更勝以往。即使是先進的模型,其能力也受到所獲取數據的限制。
我們可能會以為更智能的算法能減少對觀測的依賴,事實上,人工智能并不能取代高質量觀測的需求,反而使其變得更加關鍵。
高質量的預報離不開高質量的觀測
除了依賴于數值天氣預報模型分析初始狀態的機器學習天氣預報模型外,直接觀測預測(DOP)模型也成為研究的熱點。這類直接觀測預測模型無需數據同化或物理機制。僅基于訓練數據中觀測要素的特征,即可學習并預測大氣未來的觀測狀態。
過去常說“垃圾進,垃圾出",現在可能要改成:“如果訓練目標是垃圾,模型輸出的也是垃圾。"要訓練一個基于機器學習的天氣模型(無論是MLWP還是DOP),其訓練目標(即再分析場或觀測數據)須具備氣象學意義,且質量需達到預報預期標準。
AI 預測中觀測的角色正在轉變
基于機器學習的氣象預報技術的興起改變了觀測數據的使用方式。這些數據如今承擔著三大關鍵功能:
訓練目標數據. 目標數據的質量和代表性直接決定了機器學習預報所能達到的質量上限。再精妙的模型架構也無法彌補訓練目標的缺陷。在機器學習天氣預報中,觀測數據是再分析數據集的核心成分;而在直接觀測預報中,觀測數據則直接被用作訓練目標。
預報因子與推理數據. 在 DOP 模型的訓練和業務運行過程中,觀測數據必須全面描述大氣狀態。任何機器學習模型都無法彌補輸入數據中缺失的大氣特征。在選擇合適的數據以大化其表征能力時,氣象專業知識依然。
驗證. 必須將模型輸出與相關氣象觀測數據(如地面觀測站數據或無線電探空儀數據)進行比對,以評估預報系統的性能。
速度讓實時觀測變得至關重要
機器學習模型生成預報的速度遠超傳統的數值天氣預報。例如, 美國國家海洋和大氣管理局(NOAA) 新推出的AI驅動全球預報系統AIGFS 僅用0.3%的傳統模型計算資源,就能在約40分鐘內完成16天的預報。 而歐洲中期天氣預報中心(ECMWF)的 AIFS 模型,其計算時間主要消耗在基于數值天氣預報的數據同化環節。這些模型都屬于機器學習天氣預報模型。
由于直接觀測預測 模型不包含任何基于數值預報的數據同化過程(這類過程在超級計算機上通常需要運行 40 分鐘甚至一小時),整個端到端的預報流程可以在幾分鐘內完成。這意味著預報的延遲時間不再取決于超級計算機的處理時長,而是取決于觀測數據傳送至直接觀測預測計算過程的延遲。因此,觀測·數據的傳輸速度因此變得比以往更為關鍵。
我們的觀測網絡準備好了嗎?
隨著機器學習模型的發展加速,定期使用新數據和新架構進行再訓練將成為常態。這引發了一個關鍵問題:當前的氣象觀測網絡是否足以滿
足未來模型的需求?
基于機器學習的天氣預報的可靠性直接取決于訓練和驗證數據集的質量與全面性。為了超越傳統數值天氣預報的能力,這些數據集必須為模型訓練提供可靠且全面的目標數據,并為性能評估提供穩健的基準。
更好的觀測,更智能的 AI
核心觀點非常明確:人工智能并不會減少對精準觀測數據的需求,反而強化了這種需求。雖然保持物理觀測的可追溯性仍然是基礎,但通過監管良好的人工智能方法,可以大程度地發揮觀測數據在傳統數值預報和基于機器學習的天氣預報模型中的效用。
人工智能正在加速變革天氣預報的方式。而這場變革的根基在于精準的觀測能力。我們的觀測越精準,人工智能對大氣的理解就越深刻;而人工智能對大氣的理解越深刻,就越能通過更準確、更及時的預報,更好地保障生命財產安全。