欢迎来到必胜文档网!

时序分解和CNN-LSTM相融合的月径流预报模型

文章来源:网友投稿 时间:2023-09-23 09:55:05

雷庆文,高培强,李建林

(1.河北工程大学 水利水电学院,河北 邯郸 056038; 2.河北工程大学 河北省智慧水利重点实验室,河北 邯郸 056038;3.中国矿业大学(北京) 煤炭资源与安全开采国家重点实验室,北京 100083; 4.中国矿业大学(北京) 地球科学与测绘工程学院,北京 100083; 5.河南理工大学 资源环境学院,河南 焦作 454000)

对径流变化规律的研究是水资源合理开发利用的前提和基础[1]。水文系统受到环境变化和人类活动的影响,使得河川径流通常表现为复杂的非线性时间序列[2-3],因此,关于径流的中长期预测始终是水文预报所研究的重难点问题[4-5]。水文预报模型主要可以分为过程驱动和数据驱动两大类,基于物理机制的过程驱动模型通常需要大量的流域水文、气象资料,模型又存在参数的率定结果和普适性差等问题,在实际的水文预报工作中很难被广泛应用[6]。在不掌握多种影响径流规律的因素和流域基础水文资料的情况下,运用数据驱动模型进行径流预报是非常有效的研究方法。随着计算机技术和人工智能的发展,数据驱动的现代智能方法开始在径流预报中被广泛使用[7-9]。Feng等[10]采用量子行为粒子群优化算法结合变分模态分解和支持向量机(Support Vector Machine,SVM)建立月径流预测模型;李继清等[11]利用反向传播(Back Propagation,BP)神经网络拟合极点对称模态分解(Extreme-point Symmetric Mode Decomposition,ESMD)后的径流序列实现中长期径流预测;徐冬梅等[12]采用最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)和自适应噪声完备集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)实现对长水水文站月径流的预测;Tan等[13]提出结合集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)和人工神经网络(Artificial Neural Network,ANN)的自适应中长期径流预报模型;包丽娜等[14]先通过小波分解和相关向量机(Relevance Vector Machine,RVM)来预测径流,最后再利用差分自回归移动平均模型(Auto Regressive Integrated Moving Average,ARIMA)对小波分解和RVM的径流预测结果进行修正。

对于多要素导致的复杂径流过程,直接分析原始径流序列无法充分地反映出不同特征叠加所形成的径流变化规律。基于局部加权回归周期趋势分解算法[15](Seasonal-Trend decomposition procedure based on Loess,STL)对非平稳径流序列进行分解,可有效提取其中由确定因素导致的周期和趋势性信息及由随机因素导致的波动性信息。通过卷积神经网络(Convolutional Neural Network, CNN)对STL的分解结果进行滤波和特征抽取,过滤掉随机扰动的影响,使有效信息向下传递。长短时记忆网络(Long Short-Term Memory Network,LSTM)可对CNN的输出结果提供良好的时序拟合,融合了时序分解和CNN-LSTM优势的STL-CNN-LSTM模型所需流域基础资料少,而且预报精度也有一定保障,在工程实践中有很好的可行性和实用性。

2.1 STL算法

STL是一种通过局部加权回归(Locally weighted scatterplot smoothing, Loess)将时间序列分解为加性的趋势、季节和随机波动余项分量的过滤方法,其特点是能够得到稳健的趋势项和季节项,受数据中短暂的异常行为扭曲影响较小。通过STL将具有季节特性的月径流时间序列分解,能够更加充分地揭示出其中的季节性、持续性和非平稳性特征。

径流序列观测值可分解为

xt=Tt+St+Rt,t=1, 2,…,N。

(1)

式中:xt、Tt、St和Rt分别表示t时刻的径流序列观测值、趋势项、季节项和余项。Loess是一种局部加权回归拟合方法,STL算法的核心是Loess的迭代过程,总体可分为内循环与外循环。内循环的迭代过程如下。

内循环得到的余项R中的较大值被视为异常值,外循环通过引入稳健权重来克服内循环过程中的异常残差值,在内循环下一次迭代的步骤(3)和步骤(7)进行Loess平滑时,对邻接权重乘以稳健权重,可减小先前迭代中识别的异常值的影响,从而提高算法的鲁棒性。

2.2 CNN

CNN是一个由卷积层和子采样层构成的特征提取器,具有局部连接、权重共享等特性。典型的CNN模型结构主要有卷积层进行卷积运算提取数据内部特征;批标准化使数据更为有效地向下传递;子采样层去除不必要信息,有益于提高网络的泛化能力和计算速度。一维卷积被广泛应用于信号延迟累计的计算。信号序列x和卷积核ω的卷积y定义为:y=ω*x。假设卷积核的长度为K,则t时刻的卷积计算结果为

(2)

式中:xt-k+1为t-k+1时刻信号;ωk为信息衰减率。

卷积的作用是提取局部区域特征,不同的卷积核相当于不同的特征提取器。相比于以往研究通过分析径流序列的偏自相关性来确定模型的输入因子[10, 17],本文直接对STL的各分解成分进行卷积,可有效地简化建模过程。

2.3 LSTM神经网络

LSTM是循环神经网络的一种变体,可有效解决简单循环神经网络梯度爆炸或梯度消失的问题。LSTM的记忆单元c保存信息的生命周期长于短期记忆h,但短于网络参数,因此被称为长短时记忆网络。LSTM网络循环单元结构如图1所示。

图1 LSTM网络循环单元结构Fig.1 Recurrent unit structure of LSTM network

(3)

(4)

式中:W和U均表示权重;b为偏置;下标i、o、f分别表示输入、输出、遗忘的含义。

2.4 STL-CNN-LSTM模型

2.4.1 基于STL-CNN-LSTM的径流预测

STL时序分解和CNN-LSTM相融合的月径流预报模型是利用STL提取原始径流序列的时序分量特征,通过CNN对STL的分量特征序列进行滤波和特征重提取,并将重提取的特征序列送入具有强大时序拟合能力的LSTM网络,最后由全连接层输出预测结果。STL-CNN-LSTM计算流程如图2所示。

图2 STL-CNN-LSTM计算流程Fig.2 Calculation process of STL-CNN-LSTM

图2中STL-CNN-LSTM月径流预报模型的计算过程如下:

(1)STL算法首先将原始月径流时间序列分解为一个由趋势项、季节项和余项构成的特征向量组:{TN,SN,RN}。

(2)卷积层的输入特征映射组为一个二维张量FT∈Rτ×3,其中,τ为CNN输入特征映射窗口的宽度,相应的公式为:

(5)

(6)

(7)

(8)

式中:xi为第i个训练样本所对应时刻的实测径流值;xci为模型输出的预测值;m为训练模型的样本个数。

2.4.2 特征时窗宽度

CNN输入特征映射窗口宽度τ的选择是STL-CNN-LSTM模型中较为重要的一个参数,该模型主要通过时窗中的历史数据来恢复水文径流系统随时间的变化规律,从而实现对未来响应变量的预测。时间窗口选择过大,虽然可以充分提取出时间序列中的相关信息,但同时也引入了更多随机噪声的影响,而选择过小又无法完全揭示响应变量与历史特征时序的相关性。

虽然STL分解后的各子序列与原始径流序列具有不同的滞后显著相关性,但月径流数据有很强的年际变化规律。因此,在本研究中采用一种改进的粒子群优化算法(IPSO)[18]在τ∈[12,48]的区间内结合模型预报效果确定τ的取值。特征时窗宽度反映滞后τ个月内的各子序列特征对第τ+1个月径流xτ+1的影响,CNN-LSTM模型能对二者间的非线性函数关系提供很好的拟合。

模型验证的径流数据采用国家冰川冻土沙漠科学数据中心(www.ncdc.ac.cn)提供的黑河流域讨赖河1956—2009年的648个月径流数据。

3.1 模型评价指标

采用均方根误差RMSE、确定性系数DC、平均绝对百分比误差MAPE、相关系数R定量评价模型性能。《水文情报预报规范》(GB/T 22482—2008)规定[19],中长期径流预报相对误差RE<20%则视为合格预测值。实际工程常用合格预测在所有预测结果中的占比,即预报合格率QR,来度量模型的预报有效性。对应公式为:

(9)

(10)

(11)

(12)

3.2 STL分解结果

月径流数据通常具有明显的以年为周期的季节性效应,采用STL算法将讨赖河的月径流数据分解为以12个月为周期的季节分量、以及反映序列趋势变化的趋势项和反映径流序列随机波动的余项(图3)。

图3 径流时间序列STL分解结果Fig.3 STL decomposition results of runoff time series

3.3 预测结果分析

将讨赖河1956—2009年的前44 a的实测月径流数据作为模型训练样本,用以率定模型,后10 a的120个月径流数据用于验证模型的预报效果。使用1层CNN和1层LSTM网络搭建CNN-LSTM混合神经网络模型。其中,特征时窗宽度、CNN的卷积核个数、LSTM网络记忆单元个数和舍弃层的舍弃概率均可通过IPSO算法来辅助选取。IPSO的搜索目标是找到一组超参数使预测结果的均方根误差最小。当CNN的输入特征映射窗口宽度τ=24时,模型的预报效果较好,因此,确定所有分量特征的滞后时长为24个月。即将前24个月的分量子序列作为模型的输入特征,第25个月的径流值作为模型的输出预报值,预见期为1个月。分别对比LSTM、STL-CNN、STL-CNN-LSTM模型的预报效果。各模型的预测结果如图4和表1所示。

表1 不同模型预报效果对比Table 1 Comparison of forecast performance among different models

图4 各模型的径流预报结果Fig.4 Results of runoff forecast by different models

结合图4和表1中各模型预报效果的评价指标可以看出,常规的单一LSTM模型预测值与实测值的误差较大,拟合效果最差。STL对径流时间序列进行分解,可有效提取其中所隐含的特征信息。径流特征信息经过 CNN的滤波和重采样后,能更好的被LSTM网络所识别,使得模型预报准确性得到明显提高。融合STL的CNN模型和CNN-LSTM模型的确定性系数和预报合格率分别能达到甲级预报模型要求的0.90和85.0%的标准。STL-CNN相较于STL-CNN-LSTM模型对枯水月份的小流量数据拟合较好,但对径流序列峰值偏差较为明显。STL-CNN-LSTM有更为复杂的模型结构,对径流序列有更好的拟合效果,预测结果更接近实际径流,除预报合格率低于STL-CNN模型外,其余指标均为所有模型中最好。以上分析结果验证了本研究所提出的模型具有较高的准确性和优越性。

3.4 预测结果讨论

流域长序列径流受到人类活动和环境变化的影响,在训练模型时通常需要对径流序列进行变异诊断。对去除了确定性周期成分的月径流序列,采用Mann-Kendall法和Pettitt法[20]判定讨赖河的月径流在1985年左右发生突变。关于变异序列的处理方式很多,受文章篇幅限制,本研究不对此展开讨论。理论认为机器学习模型能够捕捉并学习到气候变化和人类活动部分信息,并相应的体现在模型参数变化上[6]。所以可选择突变后的径流序列作为衡量模型稳定性的测试数据,通过调整参数,如果测试效果表现较好,则说明此模型对人类活动和环境变化具备一定的适应性。

冰沟水文站受2001年兴修水利工程的影响失去了测站控制条件,讨赖河的流量监测站点从冰沟水文站下迁至嘉峪关水文站。为检验本研究所提模型在径流规律受到人类活动和环境变化影响下的预报效果,将上游修建了水利工程后的径流数据作为测试集。从预测结果来看,此模型具有较好的稳定性和泛化能力。但自2004年后讨赖河1月份的实测径流量出现了历史从未有过的最低值,图5反映了各模型在10 a的月径流预报中,各月份满足预报相对误差RE<20%的情况,可以看出几乎所有模型对1月份的径流预测效果均表现不佳。STL-CNN-LSTM模型相较于STL-CNN模型有更强的非线性拟合能力,但受随机扰动的影响也更明显。在以MSE为损失函数时,神经网络的参数更新会倾向于使径流序列峰值得到更好的拟合,从而造成了对枯水期径流的一般变化规律捕捉不足,导致枯水期的预报合格率低于STL-CNN模型。总体来看,STL对径流序列进行分解,可使得径流变化规律更易被神经网络所识别。

图5 不同模型各月份预测合格数量Fig.5 Number of qualified forecasts by different models in each month

为提高非平稳性径流序列的预报准确性,提出一种STL时序分解和CNN-LSTM相融合的月径流预报模型。以讨赖河的月径流预测分析为例,对比各模型效果,可以得到以下结论:

(1)相较常规的LSTM模型,采用径流时序分解技术,能更好地呈现出径流的周期、趋势等本质特征,使得非平稳径流信号能更好地被CNN-LSTM混合神经网络模型所识别。因此,可以较为显著地提高模型的预测能力。

(2)预报模型对径流时间序列的广泛性、波动性、典型性非常敏感,选择适当的模型能够有效地提高预测的效率和精度。

(3)CNN-LSTM混合神经网络模型的输入并不局限于径流序列,在后期研究中还可加入一些影响径流变化规律的特征数据,如降水、蒸发等气象数据以及一些与径流遥相关的海温指数和大气环流等数据。通过考虑动力学特征的成因分析模型对环境变化和人类活动的适应性要更强。

猜你喜欢径流卷积神经网络基于3D-Winograd的快速卷积算法设计及FPGA实现北京航空航天大学学报(2021年9期)2021-11-02神经网络抑制无线通信干扰探究电子制作(2019年19期)2019-11-23从滤波器理解卷积电子制作(2019年11期)2019-07-04基于傅里叶域卷积表示的目标跟踪算法北京航空航天大学学报(2018年1期)2018-04-20Topmodel在布哈河流域径流模拟中的应用水利科技与经济(2016年9期)2016-04-22基于神经网络的拉矫机控制模型建立重型机械(2016年1期)2016-03-01复数神经网络在基于WiFi的室内LBS应用大连工业大学学报(2015年4期)2015-12-11探秘“大径流”交通建设与管理(2015年15期)2015-03-20攻克“大径流”交通建设与管理(2015年15期)2015-03-20基于支持向量机回归和RBF神经网络的PID整定海军航空大学学报(2015年4期)2015-02-27

推荐访问:径流 时序 分解

本文来源:http://www.triumph-cn.com/fanwendaquan/gongwenfanwen/2023/0923/108339.html

推荐内容