Processing math: 40%

搜索

x

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于机器学习的非线性局部Lyapunov向量集合预报订正

康俊锋 冯松江 邹倩 李艳杰 丁瑞强 钟权加

康俊锋, 冯松江, 邹倩, 李艳杰, 丁瑞强, 钟权加. 基于机器学习的非线性局部Lyapunov向量集合预报订正. 物理学报, 2022, 71(8): 080503. doi: 10.7498/aps.71.20212260
引用本文: 康俊锋, 冯松江, 邹倩, 李艳杰, 丁瑞强, 钟权加. 基于机器学习的非线性局部Lyapunov向量集合预报订正. 物理学报, 2022, 71(8): 080503. doi: 10.7498/aps.71.20212260
Kang Jun-Feng, Feng Song-Jiang, Zou Qian, Li Yan-Jie, Ding Rui-Qiang, Zhong Quan-Jia. Machine learning based method of correcting nonlinear local Lyapunov vectors ensemble forecasting. Acta Phys. Sin., 2022, 71(8): 080503. doi: 10.7498/aps.71.20212260
Citation: Kang Jun-Feng, Feng Song-Jiang, Zou Qian, Li Yan-Jie, Ding Rui-Qiang, Zhong Quan-Jia. Machine learning based method of correcting nonlinear local Lyapunov vectors ensemble forecasting. Acta Phys. Sin., 2022, 71(8): 080503. doi: 10.7498/aps.71.20212260

基于机器学习的非线性局部Lyapunov向量集合预报订正

康俊锋, 冯松江, 邹倩, 李艳杰, 丁瑞强, 钟权加

Machine learning based method of correcting nonlinear local Lyapunov vectors ensemble forecasting

Kang Jun-Feng, Feng Song-Jiang, Zou Qian, Li Yan-Jie, Ding Rui-Qiang, Zhong Quan-Jia
Article Text (iFLYTEK Translation)
PDF
HTML
导出引用
  • 基于Lorenz96模型初步探讨了机器学习算法提高非线性局部Lyapunov向量(NLLV)集合预报效果的可行性和有效性. 结果表明: 基于岭回归算法和NLLV集合预报结果建立的机器学习模型(Ens-ML)能够有效提高整体预报技巧, 而且优于集合平均预报(EnsAve)、控制预报(Ctrl)以及基于Ctrl结果建立的机器学习模型(Ctrl-ML). 同时, 还发现Ens-ML的预报技巧改进程度依赖于集合成员的数量, 即增加集合成员数有助于提高Ens-ML模型的整体预报准确率. 通过对比个例预报表现得到, 随着预报时间延长, Ens-ML, Ctrl-ML和EnsAve的个例预报误差逐渐小于Ctrl. 进一步分析Ens-ML, Ctrl-ML和EnsAve预报的吸引子, 发现它们的概率分布的值域收缩、峰度增大并向平均值靠拢, 尤其Ens-ML的表现更为明显.
    In this study, the feasibility and effectiveness of machine learning algorithm to improve ensemble forecasts using nonlinear local Lyapunov vectors (NLLVs) are explored preliminarily based on the Lorenz96 model. The results show that the machine learning model (Ens-ML) based on the ridge regression algorithm and the results of NLLV ensemble forecasting can effectively improve the overall forecasting skill. The Ens-ML outperforms the ensemble-averaged forecasting (EnsAve) and control forecasts (Ctrl) as well as the machine learning model based on Ctrl results (Ctrl-ML). It is also found that the improvement of forecasting skill depends on the total number of ensemble members used in the Ens-ML model, i.e. the increase of the number of ensemble members is conducive to the improvement of forecasting skill and to the decrease of overfitting in the early stage. By comparing the performances among different experimental cases, we find that the experimental forecasting errors of Ens-ML, Ctrl-ML and EnsAve are gradually smaller than that of Ctrl as the forecasting time increases. The attractors forecasted by Ens-ML, Ctrl-ML and EnsAve are also analyzed. Their attractor probability distributions show a contraction of the value domain, an increase in kurtosis and a convergence to the mean, especially for Ens-ML.
      PACS:
      05.45.-a(Nonlinear dynamics and chaos)
      92.60.Wc(Weather analysis and prediction)
      通信作者: 钟权加, zqj@lasg.iap.ac.cn
    • 基金项目: 国家自然科学基金(批准号: 42105059, 41975070)、上海台风研究基金(批准号: TFJJ202108)和江西省03专项及5G项目(批准号: 20204ABC03A04)资助的课题.
      Corresponding author: Zhong Quan-Jia, zqj@lasg.iap.ac.cn
    • Funds: Project supported by the National Natural Science Foundation of China (Grant Nos. 42105059, 41975070), the Shanghai Typhoon Research Foundation (Grant No. TFJJ202108), and the Jiangxi 03 and 5G project, China (Grant No. 20204ABC03A04).

    近几十年来, 得益于计算机硬件的快速发展、数值模式和资料同化技术的研发和应用, 数值预报取得了长足的进步, 提升了天气预报和气候预测的准确率. 然而, 大气作为一个具有混沌特性的非线性系统, 其预报结果存在一定的不确定性[1]. 最早, Leith[2]和Epstein[3]提出了集合预报的思想和方法来应对数值预报中的不确定性问题, 其基本思路是在初始状态上叠加一组扰动生成初始集合, 并分别积分各个初始成员得到一组预报结果的集合. 一方面, 集合平均的非线性滤波作用可以过滤不可预报的噪音, 保留可预报的有用信息; 另一方面, 根据集合成员的预报结果可获得概率预报. 自20世纪90年代以来, 集合预报在天气预报与气候预测领域得到了广泛的研究和应用, 众多研究和业务应用的结果都表明集合预报是减小预报不确定性、提高预报水平的有效途径[4-6].

    针对数值预报中的初值不确定性和模式本身的不确定性, 前人相应发展了初值扰动和模式物理扰动以及多模式集合预报方法[7]. 假设在模式完美情况下, 初始集合生成的关键是如何产生能够很好描述初始状态不确定性的扰动场. 为此, 国内外学者相继发展了多种初值集合生成方法, 代表性的包括繁殖向量(BV)[8,9]、奇异向量(SV)[10]和集合卡尔曼滤波(EnKF)[11,12]方法. 其中, BV和SV方法发展较为成熟, 它们都是基于误差增长动力学理论发展起来的方法, 主要通过抓住增长的扰动结构和演变来反映数值预报误差的不确定性. 尽管BV和SV方法在业务上得到较好的应用, 但仍存在一定的不足. 例如, SV方法基于线性误差增长理论, 具有线性约束的局限性, 不能很好地描述误差非线性增长特征. 为此, Duan和Huo[13]发展了CNOP方法来表征误差的非线性增长模态. 与SV和CNOP方法相比, BV方法无需复杂的切线性和伴随模式, 计算非常简便和省时. 但是BV扰动是在动力系统中相同的基流演化得到, 导致产生的初始扰动结构较为相似, 独立性不足[14]. 考虑BV方法的优点和不足, 最近我国学者提出了非线性局部Lyapunov向量(NLLV)[15,16]集合预报新方法, 该方法利用和BV方法类似的简便的繁殖思想生成扰动, 能够很好地抓住非线性动力系统中的增长误差结构, 同时又通过正交化弥补BV方法产生的扰动结构依赖性较强的不足, 有助于进一步提升集合初值扰动的产生质量.

    近年来, 随着大数据科学的发展, 越来越多的研究将机器学习算法和人工智能技术应用于挖掘海量的气象数据信息并加以利用, 以提高天气预报和气候预测的准确率[17-19]. 一方面, 既有利用单一数值模式的不同气象要素构建预报预测模型, 例如, 利用机器学习中的随机森林算法构建短时地面风场预报模型, 能够有效预报地面1—6 h风场变化[20]; 另一方面, 也有基于单个数值模式集合预报结果或者多模式的集合预报结果, 结合机器学习算法建立集合预报机器学习模型, 从而达到提高预报预测准确率的目的. 比如, 通过机器学习算法对华北气温的多模式集合预报结果进行建模订正, 其订正效果明显优于数值模式的单一预报和多模式的集合平均[21]. 此外, 也有学者基于深度学习模型构建了长期气候预测模型, 实现了对ENSO的有效预测[22].

    鉴于NLLV是一种新的集合预报方法, 具有一定的理论创新性, 同时机器学习方法又在气象领域具有广阔的应用前景. 因此, 本文将基于简单的Lorenz96模型开展集合预报试验, 然后结合机器学习算法分别利用NLLV的集合预报和单一控制预报建立机器学习模型, 并从整体预报效果、不同个例预报误差大小、吸引子概率分布以及集合成员个数的使用等多个不同角度探讨机器学习算法和NLLV集合预报相结合的可行性和有效性.

    Lorenz96模型具有对初值极端敏感性和非线性的特点, 能够作为大气系统的低阶近似, 广泛应用于大气可预报性和集合预报研究[15,23], 该模型动力方程组可表示为

    dXi/dt=(Xi+1Xi2)Xi1Xi+F, (1)

    其中, Xi (i = 1, 2, ···, 40)为模型状态变量, 定常强迫项F = 8, 数值积分采用四阶龙格-库塔格式, 积分步长为0.05时间单位(tus). 在Lorenz96模型的混沌吸引子上每间隔0.05 tus选取一个状态作为集合预报试验的初始态, 本研究共选取了10000个初始态作为集合预报个例, 每个个例的积分步数为41. 在Lorenz96模型中每间隔0.2 tus大致对应1 d[24]. 因此, 积分41步共为2.05 tus, 大致对应10 d.

    NLLV是一种生成集合预报初始扰动的新方法[15,16], 该方法产生的初始集合成员NLLVs具有正交性、独立性以及流依赖性等特点. 因此, 它们既能够描述不同方向的误差增长率, 还能够很好地反映误差结构随天气、气候等混沌系统时空演化的特征[25]. 基于上述优势, NLLV方法逐渐应用于Lorenz模型、准地转正压模式、中等复杂程度的ENSO动力耦合模式(Zebiak-Cane模式)以及新一代中尺度数值模式(WRF模式)的集合预报研究, 并发现其能够有效地提高预报技巧[15,26,27]. NLLV方法产生扰动制作集合预报的流程如图1所示, 当NLLV繁殖开始时, 将一组初始随机扰动添加到分析状态上进行积分, 再对积分的结果进行正交化处理并尺度化至初始扰动大小, 然后又将其叠加到新的分析状态上, 经过多个繁殖循环得到NLLVs. 参考Feng等[15]的研究, 当集合成员达到一定数量时, 使用更多的成员也只能有限地提高预报技巧, 因此本研究使用NLLV方法共生成6个集合成员.

    图 1 NLLVs扰动生成示意图[15]\r\nFig. 1. Schematic diagram of the generation of NLLVs[15] .
    图 1  NLLVs扰动生成示意图[15]
    Fig. 1.  Schematic diagram of the generation of NLLVs[15] .

    岭回归属于多元线性回归方法的一种, 其在最小二乘法的基础上改进而来, 能够很好地解决多重共线性数据集的回归问题[28,29]. 考虑到本研究的NLLV集合预报试验数据集中各预报成员之间呈现强相关性, 具有显著的共线性特征(图2), 所以将该方法作为构建机器学习模型的算法. 在岭回归模型的构建过程中将预报成员作为特征变量xi(i = 1, 2, 3, ···, 7), 其模型框架可表示为

    图 2 各集合成员间的相关系数矩阵\r\nFig. 2. Correlation coefficient matrix of ensemble members.
    图 2  各集合成员间的相关系数矩阵
    Fig. 2.  Correlation coefficient matrix of ensemble members.
    f(x)=wixi+b (2)

    f(x)={\boldsymbol{w}}^{{\rm{T}}}{\boldsymbol{x}}+b\text{, } (3)

    模型的损失函数为

    J(w)= \sum (y - f(x))^{2}+λ||{\boldsymbol{w}}||^{2}\text{, } (4)

    其中wi为特征变量的回归系数, b为偏置, y为真值, λ为正则项系数; wx分别是wixi的矩阵. 用梯度下降算法对损失函数求最小解可得wb, 确定岭回归模型.

    图3给出了机器学习的建模流程. 首先, 对集合成员进行标准化预处理; 然后, 将集合预报试验的控制预报成员(Control, Ctrl)作为特征变量, 真值作为目标变量, 建立基于控制预报的机器学习模型(Control machine learning, Ctrl-ML); 接着, 将集合预报试验的集合成员作为特征变量, 真值作为目标变量, 建立基于集合成员的机器学习模型(Ensemble machine learning, Ens-ML); 上述建模过程还需要分别将两个模型的数据集划分为训练集和测试集, 其中训练集占70% (7000个), 测试集占30% (3000个). 接着, 分别对上述两个模型进行训练、测试, 在训练模型时将其迭代次数参数“max_iter”设置为None, 模型将自动寻得最优迭代次数, 正则项系数“alpha”为1.0. 最后, 对模型的测试结果进行评估并输出, 评估方法见2.4节.

    图 3 机器学习模型构建流程图\r\nFig. 3. Process of machine learning.
    图 3  机器学习模型构建流程图
    Fig. 3.  Process of machine learning.

    通过对所有集合成员做算术平均, 得到集合平均预报(ensemble average, EnsAve). 即

    {\rm{ EnsAve}}= \frac{ {1}}{ {N}} \sum_{i=1}^{N} {V}_{i} \text{, } (5)

    其中, Vi代表集合成员的值, N代表集合成员个数.

    此外, 为了从不同角度来综合评估不同方法的预报表现, 本文主要使用了可决系数(R²)、平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)和型异常相关系数(PAC)等预报评估方法[30,31].

    图4给出了一组不同预报方法下Lorenz96模型X变量的预报时间序列, 可以发现4种方法在不同的预报时段各有优劣. 在预报初始时刻0—5 tus时, Ctrl和EnsAve的效果优于Ctrl-ML和Ens-ML; 在预报中期20—28 tus, Ctrl和Ctrl-ML的预报值最接近真值, Ens-ML和EnsAve则略逊; 但是在31 tus时的波峰处, Ctrl试验的结果却是误差最大的; 到后期35—40 tus时, EnsAve和Ens-ML的预报结果明显优于Ctrl和Ctrl-ML. 通过R²和MAE等评价指标从整体表现来看, Ens-ML的R²最大, MAE和RMSE最小, 表明Ens-ML的整体预报技巧是最高的, EnsAve次之, Ctrl的预报技巧最差(见表1).

    图 4 不同预报方法下Lorenz96模型的X变量时间序列 (a) Ctrl; (b) EnsAve; (c) Ctrl-ML; (d) Ens-ML(黑线为真值的时间序列)\r\nFig. 4. The time series of X variable of Lorenz96 model for different forecast methods: (a) Ctrl; (b) EnsAve; (c) Ctrl-ML; (d) Ens-ML. Black line represents time series of true values.
    图 4  不同预报方法下Lorenz96模型的X变量时间序列 (a) Ctrl; (b) EnsAve; (c) Ctrl-ML; (d) Ens-ML(黑线为真值的时间序列)
    Fig. 4.  The time series of X variable of Lorenz96 model for different forecast methods: (a) Ctrl; (b) EnsAve; (c) Ctrl-ML; (d) Ens-ML. Black line represents time series of true values.
    表 1  不同预报方法的预报结果比较
    Table 1.  Evaluation of forecast results in different forecasting methods.
    评价方法
    CtrlEnsAveCtrl-MLEns-ML
    R²0.770.820.780.83
    MAE0.900.860.970.85
    MSE3.052.402.882.31
    RMSE1.751.551.701.52
    下载: 导出CSV 
    | 显示表格

    图5(a)所示, 由于两个机器学习模型均在预报初期出现过拟合现象, 从而导致其平均RMSE大于Ctrl和EnsAve预报. 然而, 随着预报时间的延长, Ctrl-ML和Ens-ML的RMSE逐渐分别小于Ctrl和EnsAve的误差, 尤其是Ens-ML表现最好. 此外, 根据预报序列与真值的PAC可以发现, Ens-ML优于EnsAve, 而Ctrl-ML与Ctrl的PAC曲线重合, 这可能是在Ctrl-ML机器学习模型中, 只有Ctrl作为其特征变量, Ctrl-ML只能学习到Ctrl的模式信息, 导致它们的PAC与真值的相关性较为一致. 但是, Ens-ML则能综合多个集合成员的信息, 使得最后效果优于EnsAve (图5(b)). 进一步比较3种不同方法相对于Ctrl的改进程度可以发现, 虽然两个机器学习模型在预报初期预报误差偏大, 提升比例为负(图6), 但是, 随着时间的演变EnsAve, Ctrl-ML和Ens-ML的预报误差逐渐小于Ctrl, 改进程度逐渐提高, 直到最后Ens-ML提升比例最高可达3%以上, EnsAve次之, Ctrl-ML提升最小. 上述结果表明, 机器学习对集合预报和控制预报的整体性能是有提高作用的, 并且以集合成员为特征建立的机器学习模型明显优于基于单一控制预报试验建立的机器学习模型.

    图 5 不同预报方法得到的平均RMSE (a)和平均PAC (b)随时间步长的变化\r\nFig. 5. The average RMSE (a) and average PAC (b) for different forecast methods.
    图 5  不同预报方法得到的平均RMSE (a)和平均PAC (b)随时间步长的变化
    Fig. 5.  The average RMSE (a) and average PAC (b) for different forecast methods.
    图 6 EnsAve, Ens-ML, Ctrl-ML相对于Ctrl预报的改进程度\r\nFig. 6. The improvement of the EnsAve, Ens-ML and Ctrl-ML compared to Ctrl.
    图 6  EnsAve, Ens-ML, Ctrl-ML相对于Ctrl预报的改进程度
    Fig. 6.  The improvement of the EnsAve, Ens-ML and Ctrl-ML compared to Ctrl.

    图7给出了不同预报方法的误差概率分布, 可以看出Ens-ML相比EnsAve略微提高了误差在[0, 2.5]区间的分布概率, 降低了在[2.5, 4.5]区间的概率, 在高误差区间[4.5, 6]与EnsAve基本保持一致. Ctrl-ML相比Ctrl则更加明显, 显著提高了[1, 3]区间的误差概率, 降低了[3, 6]区间的误差概率. 此外, 根据图8可以发现机器学习模型的预报效果与集合成员的数量有重要联系. 在Ens-ML模型中, 预报结果与真值的R²随着集合成员的增加而增大. 这意味着机器学习依赖NLLV的集合成员, 集合成员的增加能够显著提高模型的预报准确度. 这一结果也间接解释了Ctrl-ML模型预报效果明显不如Ens-ML的原因. 相对于Ctrl试验单一成员, 集合成员更能够反映出大气系统的不确定性状态. 集合成员的增加能够给机器学习模型提供更多的大气特征信息, 从而提高模型的预报精度. 综上所述, 整体来看机器学习模型提高了误差在低值区的概率, 降低了高值区的概率, 有助于提升整体预报效果, 并且集合成员数量对机器学习模型的效果起着至关重要的影响.

    图 7 不同预报方法的误差概率分布\r\nFig. 7. The probability distribution of forecast errors for different methods.
    图 7  不同预报方法的误差概率分布
    Fig. 7.  The probability distribution of forecast errors for different methods.
    图 8 Ens-ML模型的R² 随集合成员数的变化\r\nFig. 8. Changes of the R² with the number of ensemble member used in the Ens-ML model.
    图 8  Ens-ML模型的R² 随集合成员数的变化
    Fig. 8.  Changes of the R² with the number of ensemble member used in the Ens-ML model.

    前人的研究曾指出集合平均预报整体预报技巧优于单一控制预报, 但也存在一定比例的个例其单一控制预报优于集合预报[23]. 下文将进一步比较EnsAve, Ens-ML, Ctrl-ML模型与Ctrl单一控制预报在3000个测试个例中的预报误差大小.

    在试验初期0 tus时, EnsAve和Ens-ML的试验个例与Ctrl的试验个例主要集中在对角线附近, 说明初期时这3种方法的个例误差大小相当(图9(a), (b), (c)). 随着预报时间的延长, 大多数个例的EnsAve和Ens-ML模型误差小于Ctrl, 该结果与前人研究一致. 除此之外, 由于Ctrl-ML模型的构建过程使用的特征变量只有Ctrl成员, 使得机器学习算法在对其训练过程中只有单一特征信息与真值对应学习, 导致与Ctrl自身个例的对比中整体呈现出线性变化趋势.

    图 9 试验个例在不同时刻的EnsAve, Ctrl-ML和Ens-ML与Ctrl的预报误差 (a)—(c) 0 tus; (d)—(f) 10 tus; (g)—(i) 20 tus; (j)—(l) 30 tus; (m)—(o) 40 tus\r\nFig. 9. Scatterplot of forecast error at different leading times between the EnsAve, Ctrl-ML, Ens-ML and the Ctrl, respectively: (a)–(c) 0 tus; (d)–(f) 10 tus; (g)–(i) 20 tus; (j)–(l) 30 tus; (m)–(o) 40 tus .
    图 9  试验个例在不同时刻的EnsAve, Ctrl-ML和Ens-ML与Ctrl的预报误差 (a)—(c) 0 tus; (d)—(f) 10 tus; (g)—(i) 20 tus; (j)—(l) 30 tus; (m)—(o) 40 tus
    Fig. 9.  Scatterplot of forecast error at different leading times between the EnsAve, Ctrl-ML, Ens-ML and the Ctrl, respectively: (a)–(c) 0 tus; (d)–(f) 10 tus; (g)–(i) 20 tus; (j)–(l) 30 tus; (m)–(o) 40 tus .

    Lorenz96模型中吸引子的概率分布可以揭示系统变量在演化过程中的状态特征, 图10给出了3000测试个例采用4种不同预报方法在整个预报周期中Lorenz96模型的X变量的概率分布. 由此可以看出, Ens-ML, Ctrl-ML的概率分布趋向与真值是一致的, 这表明本试验建立的机器学习模型是可靠的, 吸引子的系统演化轨迹是基本不变的. 随着预报时间的延长, 不同时刻Lorenz96模型X变量的概率分布总体上分布一致, 但EnsAve, Ens-ML和Ctrl-ML三种方法的概率分布逐渐向中间均值部分收缩, 左右分布概率降低, 值域变窄, 峰度值越来越大, Ctrl则始终与真值基本保持一致. 其中Ens-ML和EnsAve的值域收缩最为明显, Ctrl-ML相较于Ctrl收缩程度大. 这说明机器学习模型在训练学习过程中, 有着同集合预报一样偏向平均态的特征且比EnsAve效果更好, 从而提高了预报技巧, 但左右极值分布概率的降低意味对极端事件的预报技巧是下降的.

    图 10 不同预报方法中X变量状态的概率分布随时间的变化\r\nFig. 10. Probability distributions of X variables for different leading times.
    图 10  不同预报方法中X变量状态的概率分布随时间的变化
    Fig. 10.  Probability distributions of X variables for different leading times.

    图11给出了4种方法的预报值与真值的分布对比, 也可以看出Ens-ML和EnsAve更集中更靠近真值分布, Ctrl-ML次之, 而Ctrl较前三者分布最为发散, 预报技巧最差. 可以发现在极值两端, 更多Ctrl预报点偏向极值, 而EnsAve和Ens-ML则明显比Ctrl要小得多, 这说明EnsAve和Ens-ML与真值的误差更小, 比Ctrl更接近真值.

    图 11 不同预报方法的结果与真实状态的对比分布\r\nFig. 11. Scatterplot of the forecast value.
    图 11  不同预报方法的结果与真实状态的对比分布
    Fig. 11.  Scatterplot of the forecast value.

    综上所述, 随着预报时间的推移, 多数个例的Ctrl误差逐渐大于EnsAve和机器学习模型, 并且机器学习模型和EnsAve的吸引子的概率分布出现值域变窄, 峰度值增大的特点, 总得说来Ens-ML, Ctrl-ML和EnsAve的预报技巧均优于Ctrl, 其中又以Ens-ML预报效果最佳.

    本文基于Lorenz96模型, 借助岭回归算法构建了基于控制预报和NLLV集合预报的机器学习模型, 初步探究了机器学习算法改进NLLV集合预报效果的可行性, 得到的主要结论如下.

    1) 机器学习能够有效提高NLLV集合预报的预报技巧, 且其预报改进程度明显依赖于构建机器学习模型的集合成员数, 增加集合成员数能够减小预报初期的过拟合现象, 提高预报结果与真值之间的相关系数, 究其原因可能是较多的集合成员能够提供更多的特征变量信息, 使得机器学习训练的模型精度更高.

    2) 就试验个例表现而言, 随着时间的演变, 控制预报误差大于其他3种方法的个例数增多, 在试验中后期尤为明显. 从吸引子的概率分布来看, 机器学习和集合平均都具有值域收缩、峰度增大并向平均值靠拢的特点, 且机器学习比集合平均表现更突出, 说明机器学习模型的预报结果优于集合平均和控制预报.

    本研究基于Lorenz96模型利用机器学习算法订正NLLV集合预报结果, 期望进一步改进其预报技巧. 研究发现, 机器学习模型在中后期对集合预报有较为明显的改进, 同时在预报初期有一定的过拟合现象. 虽然, 增加集合成员数目能够一定程度上解决初期的过拟合现象, 但也意味着会增加计算量, 需要更多的计算资源.

    [1]

    Lorenz E N 1963 J. Atmos. Sci. 20 130Google Scholar

    [2]

    Leith C E 1974 Mon. Wea. Rev. 102 409Google Scholar

    [3]

    Epstein E S 1969 Tellus 21 739

    [4]

    张立凤, 罗雨 2010 气象科学 30 650Google Scholar

    Zhang L F, Luo Y 2010 Sci. Meteor. Sin. 30 650Google Scholar

    [5]

    杜钧, 李俊 2014 气象科技进展 4 6

    Du J, Li J 2014 Adv. Meteor. Sci. Tech. 4 6

    [6]

    段晚锁, 汪叶, 霍振华, 周菲凡 2019 气候与环境研究 24 396

    Duan W S, Wang Y, Huo Z H, Zhou F F 2019 Clim. Env. Res. 24 396

    [7]

    杜钧, 陈静 2010 气象 36 1

    Du J, Chen J 2010 Meteor. Mon. 36 1

    [8]

    Toth Z, Kalnay E 1997 Mon. Wea. Rev. 125 3297Google Scholar

    [9]

    Toth Z, Kalnay E 1993 Bull. Amer. Meteor. Soc. 74 2317Google Scholar

    [10]

    Molteni F, Buizza R, Palmer T N, Petroliagis T 1996 Q. J. R. Meteor. Soc. 122 73Google Scholar

    [11]

    Bishop C H, Toth Z 1999 J. Atmos. Sci. 56 1748Google Scholar

    [12]

    Evensen G 2003 Ocean Dyn. 53 343Google Scholar

    [13]

    Duan W, Huo Z 2016 J. Atmos. Sci. 73 997Google Scholar

    [14]

    Feng J, Ding R, Liu D, Li J 2014 J. Atmos. Sci. 71 3554Google Scholar

    [15]

    Ding R Q, Li J, Li B 2017 Adv. Atmos. Sci. 34 1027Google Scholar

    [16]

    Norwood A, Kalnay E, Ide K, Yang S-C, Wolfe C 2013 J. Phys. A:Math. Theor. 46 254021Google Scholar

    [17]

    李娟, 尉鹏, 戴学之, 赵森, 张博雅, 吕玲玲, 胡京南 2021 环境科学研究 34 872

    Li J, Wei P, Dai X Z, Zhao S, Zhang B Y, Lv L L, Hu J N 2021 Res. Env. Sci. 34 872

    [18]

    贺圣平, 王会军, 李华, 赵家臻 2021 大气科学学报 44 26

    He S P, Wang H J, Li H, Zhao J Z 2021 Trans. Atmos. Sci. 44 26

    [19]

    康俊锋, 谭建林, 方雷, 肖亚来 2021 中国环境科学 41 4016Google Scholar

    Kang J F, Tan J L, Fang L, Xiao Y L, 2021 Chi. Env. Sci. 41 4016Google Scholar

    [20]

    付旭东, 王金艳, 李龙燕, 陈金车, 苏士翔, 常伟, 王明 2021 兰州大学学报(自然科学版) 57 503

    Fu X D, Wang J Y, Li L Y, Chen J C, Su S X, Chang W, Wang M 2021 J. Lanzhou Univ. (Natural Sciences) 57 503

    [21]

    门晓磊, 焦瑞莉, 王鼎, 赵晨光, 刘亚昆, 夏江江, 李昊辰, 严中伟, 孙建华, 王立志 2019 气候与环境研究 24 116Google Scholar

    Men X L, Jiao R L, Wang D, Zhao C G, Liu Y K, Xia J J, Li H C, Yan Z W, Sun J H, Wang L Z 2019 Clim. Env. Res. 24 116Google Scholar

    [22]

    Ham Y G, Kim J H, Luo J J 2019 Nature 573 568Google Scholar

    [23]

    梁丁, 顾斌, 丁瑞强, 李建平, 钟权加 2018 物理学报 67 070501Google Scholar

    Liang D, Gu B, Ding R Q, Li J P, Zhong Q J 2018 Acta Phys. Sin. 67 070501Google Scholar

    [24]

    Lorenz E N 1996 Predictability: A problem partly solved. Proc. Seminar on Predictability, Vol. I, Reading, United Kingdom, ECMWF, 1–18.

    [25]

    Feng J, Ding R Q, Li J P, Liu D Q 2016 Adv. Atmos. Sci. 33 1036Google Scholar

    [26]

    Hou Z, Li J, Ding R, Feng J, Duan W 2018 Clim. Dynam. 51 283Google Scholar

    [27]

    Feng J, Li J P, Ding R Q, Toth Z 2018 J. Atmos. Sci. 75 1073Google Scholar

    [28]

    Hoerl A E, Kennard R W 1970 Technometrics 12 69Google Scholar

    [29]

    Bager A, Roman M, Algelidh M, Mohammed B 2017 J. Soc. Econo. Stat. 6 30

    [30]

    胡占占, 陈传法, 胡保健 2021 环境科学学报 41 4228

    Hu Z Z, Chen C F, Hu B J 2021 Acta. Sci. Circum. 41 4228

    [31]

    Murphy A H, Epstein E S 1989 Mon. Wea. Rev. 117 572Google Scholar

    期刊类型引用(1)

    1. 叶加浩. 高分辨率影像的面向对象土地分类方法研究. 长江信息通信. 2023(03): 138-141 . 百度学术

    其他类型引用(1)

  • 图 1  NLLVs扰动生成示意图[15]

    Fig. 1.  Schematic diagram of the generation of NLLVs[15] .

    图 2  各集合成员间的相关系数矩阵

    Fig. 2.  Correlation coefficient matrix of ensemble members.

    图 3  机器学习模型构建流程图

    Fig. 3.  Process of machine learning.

    图 4  不同预报方法下Lorenz96模型的X变量时间序列 (a) Ctrl; (b) EnsAve; (c) Ctrl-ML; (d) Ens-ML(黑线为真值的时间序列)

    Fig. 4.  The time series of X variable of Lorenz96 model for different forecast methods: (a) Ctrl; (b) EnsAve; (c) Ctrl-ML; (d) Ens-ML. Black line represents time series of true values.

    图 5  不同预报方法得到的平均RMSE (a)和平均PAC (b)随时间步长的变化

    Fig. 5.  The average RMSE (a) and average PAC (b) for different forecast methods.

    图 6  EnsAve, Ens-ML, Ctrl-ML相对于Ctrl预报的改进程度

    Fig. 6.  The improvement of the EnsAve, Ens-ML and Ctrl-ML compared to Ctrl.

    图 7  不同预报方法的误差概率分布

    Fig. 7.  The probability distribution of forecast errors for different methods.

    图 8  Ens-ML模型的R² 随集合成员数的变化

    Fig. 8.  Changes of the R² with the number of ensemble member used in the Ens-ML model.

    图 9  试验个例在不同时刻的EnsAve, Ctrl-ML和Ens-ML与Ctrl的预报误差 (a)—(c) 0 tus; (d)—(f) 10 tus; (g)—(i) 20 tus; (j)—(l) 30 tus; (m)—(o) 40 tus

    Fig. 9.  Scatterplot of forecast error at different leading times between the EnsAve, Ctrl-ML, Ens-ML and the Ctrl, respectively: (a)–(c) 0 tus; (d)–(f) 10 tus; (g)–(i) 20 tus; (j)–(l) 30 tus; (m)–(o) 40 tus .

    图 10  不同预报方法中X变量状态的概率分布随时间的变化

    Fig. 10.  Probability distributions of X variables for different leading times.

    图 11  不同预报方法的结果与真实状态的对比分布

    Fig. 11.  Scatterplot of the forecast value.

    表 1  不同预报方法的预报结果比较

    Table 1.  Evaluation of forecast results in different forecasting methods.

    评价方法
    CtrlEnsAveCtrl-MLEns-ML
    R²0.770.820.780.83
    MAE0.900.860.970.85
    MSE3.052.402.882.31
    RMSE1.751.551.701.52
    下载: 导出CSV
  • [1]

    Lorenz E N 1963 J. Atmos. Sci. 20 130Google Scholar

    [2]

    Leith C E 1974 Mon. Wea. Rev. 102 409Google Scholar

    [3]

    Epstein E S 1969 Tellus 21 739

    [4]

    张立凤, 罗雨 2010 气象科学 30 650Google Scholar

    Zhang L F, Luo Y 2010 Sci. Meteor. Sin. 30 650Google Scholar

    [5]

    杜钧, 李俊 2014 气象科技进展 4 6

    Du J, Li J 2014 Adv. Meteor. Sci. Tech. 4 6

    [6]

    段晚锁, 汪叶, 霍振华, 周菲凡 2019 气候与环境研究 24 396

    Duan W S, Wang Y, Huo Z H, Zhou F F 2019 Clim. Env. Res. 24 396

    [7]

    杜钧, 陈静 2010 气象 36 1

    Du J, Chen J 2010 Meteor. Mon. 36 1

    [8]

    Toth Z, Kalnay E 1997 Mon. Wea. Rev. 125 3297Google Scholar

    [9]

    Toth Z, Kalnay E 1993 Bull. Amer. Meteor. Soc. 74 2317Google Scholar

    [10]

    Molteni F, Buizza R, Palmer T N, Petroliagis T 1996 Q. J. R. Meteor. Soc. 122 73Google Scholar

    [11]

    Bishop C H, Toth Z 1999 J. Atmos. Sci. 56 1748Google Scholar

    [12]

    Evensen G 2003 Ocean Dyn. 53 343Google Scholar

    [13]

    Duan W, Huo Z 2016 J. Atmos. Sci. 73 997Google Scholar

    [14]

    Feng J, Ding R, Liu D, Li J 2014 J. Atmos. Sci. 71 3554Google Scholar

    [15]

    Ding R Q, Li J, Li B 2017 Adv. Atmos. Sci. 34 1027Google Scholar

    [16]

    Norwood A, Kalnay E, Ide K, Yang S-C, Wolfe C 2013 J. Phys. A:Math. Theor. 46 254021Google Scholar

    [17]

    李娟, 尉鹏, 戴学之, 赵森, 张博雅, 吕玲玲, 胡京南 2021 环境科学研究 34 872

    Li J, Wei P, Dai X Z, Zhao S, Zhang B Y, Lv L L, Hu J N 2021 Res. Env. Sci. 34 872

    [18]

    贺圣平, 王会军, 李华, 赵家臻 2021 大气科学学报 44 26

    He S P, Wang H J, Li H, Zhao J Z 2021 Trans. Atmos. Sci. 44 26

    [19]

    康俊锋, 谭建林, 方雷, 肖亚来 2021 中国环境科学 41 4016Google Scholar

    Kang J F, Tan J L, Fang L, Xiao Y L, 2021 Chi. Env. Sci. 41 4016Google Scholar

    [20]

    付旭东, 王金艳, 李龙燕, 陈金车, 苏士翔, 常伟, 王明 2021 兰州大学学报(自然科学版) 57 503

    Fu X D, Wang J Y, Li L Y, Chen J C, Su S X, Chang W, Wang M 2021 J. Lanzhou Univ. (Natural Sciences) 57 503

    [21]

    门晓磊, 焦瑞莉, 王鼎, 赵晨光, 刘亚昆, 夏江江, 李昊辰, 严中伟, 孙建华, 王立志 2019 气候与环境研究 24 116Google Scholar

    Men X L, Jiao R L, Wang D, Zhao C G, Liu Y K, Xia J J, Li H C, Yan Z W, Sun J H, Wang L Z 2019 Clim. Env. Res. 24 116Google Scholar

    [22]

    Ham Y G, Kim J H, Luo J J 2019 Nature 573 568Google Scholar

    [23]

    梁丁, 顾斌, 丁瑞强, 李建平, 钟权加 2018 物理学报 67 070501Google Scholar

    Liang D, Gu B, Ding R Q, Li J P, Zhong Q J 2018 Acta Phys. Sin. 67 070501Google Scholar

    [24]

    Lorenz E N 1996 Predictability: A problem partly solved. Proc. Seminar on Predictability, Vol. I, Reading, United Kingdom, ECMWF, 1–18.

    [25]

    Feng J, Ding R Q, Li J P, Liu D Q 2016 Adv. Atmos. Sci. 33 1036Google Scholar

    [26]

    Hou Z, Li J, Ding R, Feng J, Duan W 2018 Clim. Dynam. 51 283Google Scholar

    [27]

    Feng J, Li J P, Ding R Q, Toth Z 2018 J. Atmos. Sci. 75 1073Google Scholar

    [28]

    Hoerl A E, Kennard R W 1970 Technometrics 12 69Google Scholar

    [29]

    Bager A, Roman M, Algelidh M, Mohammed B 2017 J. Soc. Econo. Stat. 6 30

    [30]

    胡占占, 陈传法, 胡保健 2021 环境科学学报 41 4228

    Hu Z Z, Chen C F, Hu B J 2021 Acta. Sci. Circum. 41 4228

    [31]

    Murphy A H, Epstein E S 1989 Mon. Wea. Rev. 117 572Google Scholar

  • [1] 张孙成, 韩同伟, 王如盟, 杨艳陶, 张小燕. 基于机器学习的菱形穿孔石墨烯负泊松比效应预测与优化. 物理学报, 2025, 74(9): . doi: 10.7498/aps.74.20241624
    [2] 郭焱, 吕恒, 丁春玲, 袁晨智, 金锐博. 分数阶涡旋光衍射过程的机器学习识别. 物理学报, 2025, 74(1): 014203. doi: 10.7498/aps.74.20241458
    [3] 张童, 王加豪, 田帅, 孙旭冉, 李日. 基于机器学习的铸件凝固过程动态收缩行为. 物理学报, 2025, 74(2): 028103. doi: 10.7498/aps.74.20241581
    [4] 王鹏, 麦麦提尼亚孜·麦麦提阿卜杜拉. 机器学习的量子动力学. 物理学报, 2025, 74(6): 060701. doi: 10.7498/aps.74.20240999
    [5] 邓祥文, 伍力源, 赵锐, 王嘉鸥, 赵丽娜. 机器学习在光电子能谱中的应用及展望. 物理学报, 2024, 73(21): 210701. doi: 10.7498/aps.73.20240957
    [6] 宋睿, 刘雪梅, 王海滨, 吕皓, 宋晓艳. 机器学习辅助的WC-Co硬质合金硬度预测. 物理学报, 2024, 73(12): 126201. doi: 10.7498/aps.73.20240284
    [7] 张桥, 谭薇, 宁勇祺, 聂国政, 蔡孟秋, 王俊年, 朱慧平, 赵宇清. 基于机器学习和第一性原理计算的Janus材料预测. 物理学报, 2024, 73(23): 230201. doi: 10.7498/aps.73.20241278
    [8] 张旭, 丁进敏, 侯晨阳, 赵一鸣, 刘鸿维, 梁生. 基于机器学习的激光匀光整形方法. 物理学报, 2024, 73(16): 164205. doi: 10.7498/aps.73.20240747
    [9] 张嘉晖. 蛋白质计算中的机器学习. 物理学报, 2024, 73(6): 069301. doi: 10.7498/aps.73.20231618
    [10] 郭唯琛, 艾保全, 贺亮. 机器学习回归不确定性揭示自驱动活性粒子的群集相变. 物理学报, 2023, 72(20): 200701. doi: 10.7498/aps.72.20230896
    [11] 刘烨, 牛赫然, 李兵兵, 马欣华, 崔树旺. 机器学习在宇宙线粒子鉴别中的应用. 物理学报, 2023, 72(14): 140202. doi: 10.7498/aps.72.20230334
    [12] 管星悦, 黄恒焱, 彭华祺, 刘彦航, 李文飞, 王炜. 生物分子模拟中的机器学习方法. 物理学报, 2023, 72(24): 248708. doi: 10.7498/aps.72.20231624
    [13] 张逸凡, 任卫, 王伟丽, 丁书剑, 李楠, 常亮, 周倩. 机器学习结合固溶强化模型预测高熵合金硬度. 物理学报, 2023, 72(18): 180701. doi: 10.7498/aps.72.20230646
    [14] 张嘉伟, 姚鸿博, 张远征, 蒋伟博, 吴永辉, 张亚菊, 敖天勇, 郑海务. 通过机器学习实现基于摩擦纳米发电机的自驱动智能传感及其应用. 物理学报, 2022, 71(7): 078702. doi: 10.7498/aps.71.20211632
    [15] 林键, 叶梦, 朱家纬, 李晓鹏. 机器学习辅助绝热量子算法设计. 物理学报, 2021, 70(14): 140306. doi: 10.7498/aps.70.20210831
    [16] 陈江芷, 杨晨温, 任捷. 基于波动与扩散物理系统的机器学习. 物理学报, 2021, 70(14): 144204. doi: 10.7498/aps.70.20210879
    [17] 杨自欣, 高章然, 孙晓帆, 蔡宏灵, 张凤鸣, 吴小山. 铅基钙钛矿铁电晶体高临界转变温度的机器学习研究. 物理学报, 2019, 68(21): 210502. doi: 10.7498/aps.68.20190942
    [18] 梁丁, 顾斌, 丁瑞强, 李建平, 钟权加. 基于Lorenz模型的集合预报与单一预报的比较研究. 物理学报, 2018, 67(7): 070501. doi: 10.7498/aps.67.20172144
    [19] 郑志海, 封国林, 黄建平, 丑纪范. 基于延伸期可预报性的集合预报方法和数值试验. 物理学报, 2012, 61(19): 199203. doi: 10.7498/aps.61.199203
    [20] 封国林, 董文杰. 集合预报物理基础的探讨. 物理学报, 2003, 52(9): 2347-2353. doi: 10.7498/aps.52.2347
  • 期刊类型引用(1)

    1. 叶加浩. 高分辨率影像的面向对象土地分类方法研究. 长江信息通信. 2023(03): 138-141 . 百度学术

    其他类型引用(1)

计量
  • 文章访问数:  6357
  • PDF下载量:  96
  • 被引次数: 2
出版历程
  • 收稿日期:  2021-12-07
  • 修回日期:  2021-12-30
  • 上网日期:  2022-01-26
  • 刊出日期:  2022-04-20

/

返回文章
返回