Processing math: 46%

融合Prophet与PCA技术的CNN-LSTM模型在水质预测中的应用

肖克, 张建军, 谭文武, 王理, 宋玲毓, 林海军

肖克,张建军,谭文武,等. 融合Prophet与PCA技术的CNN-LSTM模型在水质预测中的应用[J]. 计量科学与技术,2024, 68(10): 38-44. DOI: 10.12338/j.issn.2096-9015.2024.0109
引用本文: 肖克,张建军,谭文武,等. 融合Prophet与PCA技术的CNN-LSTM模型在水质预测中的应用[J]. 计量科学与技术,2024, 68(10): 38-44. DOI: 10.12338/j.issn.2096-9015.2024.0109
XIAO Ke, ZHANG Jianjun, TAN Wenwu, WANG Li, SONG Lingyu, LIN Haijun. Application of CNN-LSTM Model Integrating Prophet and PCA Techniques for Water Quality Prediction[J]. Metrology Science and Technology, 2024, 68(10): 38-44. DOI: 10.12338/j.issn.2096-9015.2024.0109
Citation: XIAO Ke, ZHANG Jianjun, TAN Wenwu, WANG Li, SONG Lingyu, LIN Haijun. Application of CNN-LSTM Model Integrating Prophet and PCA Techniques for Water Quality Prediction[J]. Metrology Science and Technology, 2024, 68(10): 38-44. DOI: 10.12338/j.issn.2096-9015.2024.0109

融合Prophet与PCA技术的CNN-LSTM模型在水质预测中的应用

基金项目: 湖南省自然科学基金(2022JJ90013、2023JJ60157、2022JJ90044);国家自然科学基金(51775185);湖南省研究生创新基金(QL20230130);湖南师范大学校企合作(5312201812)。
详细信息
    作者简介:

    肖克(1983-),湖南省计量检测研究院正高级工程师,研究方向:环境化学,邮箱:261758604@qq.com

    通讯作者:

    谭文武(1997-),天翼电子商务有限公司广东分公司工程师,研究方向:数据科学,邮箱:396987102@qq.com

  • 中图分类号: TB99

Application of CNN-LSTM Model Integrating Prophet and PCA Techniques for Water Quality Prediction

  • 摘要: 为了降低传统CNN-LSTM模型进行水质预测时可能会出现的错误发生率,提出了一种基于Prophet模型与PCA的CNN-LSTM水质预测方法。在水质监测数据清洗过程中采用Prophet模型进行异常值处理,使用PCA方法对影响变量进行降维,消除变量关联性,把处理结果作为CNN-LSTM模型输入,对水质总氮指标进行预测。通过实验对基于Prophet模型与PCA的CNN-LSTM水质预测方法进行验证,实验结果表明:该方法相对于CNN-LSTM模型在MAE、RMSE和MSE三种评价指标上都有了较大的提升,其中MSE提升了13%,RMSE提升了6.7%,MAE提升了5.6%。
    Abstract: To mitigate potential error rates in traditional CNN-LSTM models for water quality prediction, this study proposes an enhanced CNN-LSTM water quality prediction method incorporating the Prophet model and Principal Component Analysis (PCA). In the data preprocessing phase, the Prophet model is employed for outlier detection and handling of water quality monitoring data. PCA is then utilized to reduce the dimensionality of influencing variables and eliminate variable correlations. The processed results serve as input for the CNN-LSTM model to predict the total nitrogen index of water quality. Experimental validation of the proposed method demonstrates significant improvements over the standard CNN-LSTM model across three evaluation metrics: Mean Absolute Error (MAE), Root Mean Square Error (RMSE), and Mean Squared Error (MSE). Specifically, the proposed method achieved a 13% reduction in MSE, a 6.7% decrease in RMSE, and a 5.6% improvement in MAE. These results highlight the effectiveness of integrating Prophet and PCA techniques with CNN-LSTM for enhancing water quality prediction accuracy and reliability.
  • 地表水水质预测是反映流域水质状况的重要依据。目前主要的水质预测方法分为两类:一类是机理性预测方法,该方法需要对采样数据的分布进行全面考虑,不仅要涵盖气象、土壤等多个方面,还需要使用大量精确的数据,综合运用多个指标,对水质的变化趋势进行预测;另一类是非机理性预测方法,由数据驱动,通过数据分析和统计学方法来预测未来水质[13]

    目前,时间序列预测法[46]、神经网络预测法[79]、灰色预测法[1012]和传统机器学习预测法[1315]等非机理性水质预测方法被广泛应用于水质数据的预测。袁涛等[16]提出了一种多因素长短期记忆(Long Short-Term Memory,LSTM)模型,采用皮尔逊优化方法来预测水质中溶解氧浓度,通过挑选具有高相关性的变量因素,相比于常规的单因素和多因素预测具有更高的准确性。李文静等[17]提出了一种基于简化型LSTM的神经网络预测方法,用于预测短期内的污水的生化需氧量浓度。该方法通过简化LSTM神经网络耦合参数,不仅减少了训练时间,而且还提高了时间序列的预测精度。Tan等[18]提出了一种卷积神经网络(Convolutional Neural Network,CNN)与LSTM模型相结合用于预测地表水中某流域的溶解氧短期内的浓度,该组合模型结合了一维CNN模型提取水质信息特征的能力和LSTM模型对时间序列更为敏感的特点,在峰值和精度方面相比于常规LSTM模型具有更好的预测效果。Tan等[19]提出了一种基于主成分分析(Principal Component Analysis,PCA)与LSTM相结合的模型,用于预测地表水中溶解氧浓度。孙龙清等[20]提出了一种基于改进的天牛搜索算法(Improved Beetle Antennae Search Algorithm, IBAS)和LSTM的组合模型来预测池塘水体中2小时后的溶解氧含量。

    但因水质原始数据在收集过程存在大量冗余信息,在利用CNN-LSTM模型进行学习时可能会出现大量低效误差,不仅增加训练负荷,而且还会提高错误发生率。为此,本文提出一种基于Prophet模型与PCA的CNN-LSTM水质预测方法。首先在数据清洗过程中,采用Prophet模型进行异常值处理;其次使用PCA方法对影响变量进行降维,消除变量关联性;最后把处理结果作为CNN-LSTM模型输入,并对水质进行预测。把所提方法应用于总氮指标预测,实验结果表明:所提方法相对于CNN-LSTM模型在均方误差(Mean Square Error, MSE)、均方根误差(Root Mean Square Error, RMSE)、平均绝对误差(Mean Absolute Error, MAE)三种评价指标上都有了较大的提升,其中MSE提升了13%,RMSE提升了6.7%,MAE提升了5.6%。

    水质监测数据来源于中国环境监测总站,包括pH值、水温、总磷、高锰酸盐指数、溶解氧、氨氮、电导率和浊度等9种水质变量数据[21];此外,还从环境专业知识服务系统下载数据作为补充[22]

    选取某流域的水质监测站点作为主要研究对象,导入2018年7月3日至2020年12月30日共计5472条水质监测数据,如表1所示。

    表  1  水质指标数据
    Table  1.  Water quality indicator data
    指标名称数据个数取值范围缺失数据量
    溶解氧54521.787~23.84220
    水温54522.525~33.32520
    总氮54471.891~12.17325
    PH52537.1325~9.2975219
    电导率5254193.725~719.875218
    浊度48183~6712.13654
    高锰酸盐指数49731.636~11.62499
    氨氮51160~1.886125356
    总磷49730.014~0.526333499
    下载: 导出CSV 
    | 显示表格

    根据国家生态环境部颁布的《地表水环境质量标准(GB 3838-2002)》,影响河流与湖泊水质类别有总磷、水温、pH值等24项影响因素。其中,总氮是评价水体被污染程度的重要指标之一,本文选择使用总氮指标进行短期预测。

    在进行数据挖掘和分析之前,数据的预处理是一个重要的工作。数据预处理包括数据清理、数据转换和数据分割三个步骤。数据清理主要包括缺失数据的填补和异常值的过滤。数据转换包括对输入序列进行归一化处理,以提高算法的精度和效率。数据分割将输入序列划分为训练集和测试集,以验证算法的性能和泛化能力。

    表1中可以看出各水质指标的缺失数据量不同,因此可以根据缺失量的大小将水质数据的缺失情况分为两类。第一类是少量的数据缺失,这种情况下缺失值的比例较小,可以直接删除缺失值样本。第二类是存在较多数据的缺失值,这种情况使用拉格朗日插值法进行填补,通过对指标进行高阶非线性拟合,能够得到较好的效果。经过数据清洗后,最终的数据集如图1所示。

    图  1  缺失值处理后水质数据集(部分)
    Figure  1.  Water quality dataset after missing value processing (partial)

    目前常用的异常值检测方法可以分为两类,一类是统计的方法[23],像3σ准则和箱型图等,这些方法基于数据的分布特征进行异常值判定,能够快速识别和定位异常数据点。另一类是聚类的方法[24],像k-means,基于密度的噪声应用空间聚类(Density-Based Spatial Clustering of Applications with Noise,DBCAN)等,但是这种基于距离和密度的方法需要人为提前设定簇的大小,可能会导致在异常值检测任务中难以确定簇的数量。因水质数据序列具备时间序列特征,本文使用了一种基于时间序列分析的Prophet异常值处理方法用于水质数据异常值检测。

    Prophet模型是Facebook开发的一种高效的Python语言时间序列预测工具,它可以自动分析和预测未来的趋势,具有较高的精确度,其最大的特点是可以进行大范围、小粒度的预测,并且提供一个可靠的置信区间,从而使得它在处理数据缺失和趋势变化时具有极高的稳定性[2526],同时该方法能将异常值处理后的数据通过趋势变化进行异常值填补。

    对于2018年7月3日至2020年12月30日的总氮指标,使用Prophet模型进行异常值检测的结果如图2所示。黑色离散点代表原始序列的分布情况,蓝色区域为95%的置信区间,上下界表示原始序列波动的最大值和最小值。数据分布在该区域内被认定为正常值,而超出95%置信区间的少量数据被判定为异常值,在图中用红色标记。深蓝色线代表使用时间序列拟合的取值,异常数据可以通过拟合值进行填补。

    图  2  总氮异常值检测结果
    Figure  2.  Total nitrogen anomaly detection results

    根据图2所示的总氮异常值检测结果可以看出,蓝色置信区间外的异常值主要分为两种情况。第一种情况是数据持续增长幅度过大,导致峰值区域超出了总体变化范围,例如在2019年5月和2019年7月的时间点出现异常值,这可能是由于降雨量过大导致氮磷污染物进入流域,从而导致总氮浓度持续上升。第二种情况则是在某些特定时间点上出现急剧增长或下降的离群点,例如在2019年6月和2020年6月的时间点,这种情况可能与系统故障或工厂排污事件有关。为了降低异常值对预测结果的影响,在实际预测中将这些异常值替换为Prophet模型生成的拟合值。

    归一化是一种常见的数据预处理技术,进行归一化处理的主要原因是消除不同变量之间的量纲差异和数值差异对数据分析或机器学习模型的影响,从而使得不同特征的权重可以更加平等地影响结果。常用的归一化方法包括max-min归一化、z-score归一化等。本文针对水质数据的分布特征,选择了max-min归一化方法进行处理。该方法通过对数据进行线性变换,将数据缩放到[0, 1]的范围内,既能保留原有数据分布特征,又能有效地消除数据之间的差异。max-min归一化的定义可以表示为式(1)。

    Znorm=ZZminZmaxZmin (1)

    式中,Znorm表示进行归一化后的新序列;Z为输入的原始序列;ZminZmax分别为输入序列的最小值和最大值。

    在机器学习中,数据通常被分成训练集和测试集两部分。通过将数据集划分为训练集和测试集,可以在构建预测模型时避免过拟合,同时也能够通过测试集对最终模型进行独立的评估和验证,从而确保模型的泛化能力和性能。本文将从2018年7月3日到2020年12月30日的数据按照8:2的比例分成两个部分,其中将2018年7月3日到2020年6月30日的数据作为训练集,用于训练水质预测模型以获得最佳参数。而2020年7月1日到2020年12月30日的数据则作为测试集,用于评估模型的预测效果。

    在分类问题和回归问题中,评价指标的选择因问题而异。常用的一些评价指标有MSE、RMSE、MAE、皮尔逊相关系数(Pearson Correlation Coefficient, PCCs)等[27]

    实验采用Python作为编程语言,并调用Scikit-learn和Numpy等机器学习软件包。

    PCA最早由英国数理统计学家皮尔逊于1901年提出[28],是一种常用的数据降维技术,在许多领域得到了广泛应用。在多变量水质数据的预测中,变量之间的相关性会影响预测结果,因此可以使用PCA来消除变量之间耦合的影响。设输入的水质序列Xm=(x1m,x2m,,xnm)T,n=1,2,,p,其中m为样本数量,p为样本指标个数。对输入水质数据进行主成分分析的具体步骤如下:

    (1)在对水质数据进行降维处理前,应充分考虑不同水质指标之间量纲的不同给实际降维处理带来的偏差,需要通过标准化来对数据进行处理,标准化的定义可以表示为式(2)。

    Znm=xnmˉxmσm (2)

    式中,xnm为实际变量值;ˉxm是实际平均值;σmxnm的标准差;Znm为实际标准化后数据矩阵。

    (2)对各变量的相关性进行分析,得出相关系数的方程式,并给出了相应的公式R,其定义可以表示为式(3)。

    R=(xnm¯xnm)(ynm¯ynm)(xnm¯xnm)2(ynm¯ynm)2 (3)

    (3)求出R的特征根 {\lambda }_{1}\geqslant {\lambda }_{2}\geqslant \cdots \geqslant {\lambda }_{n} > 0 和特征向量 {A}_{j}=({a}_{1j},{a}_{2j},\cdots ,{a}_{nj}{)}^{T},j=\mathrm{1,2},\cdots ,n

    (4)对方差贡献比 {e}_{k} 和累计方差贡献 {e}_{\left(k\right)} 进行计算,它们的定义如式(4)、(5)所示。

    {e}_{k}=\dfrac{{\lambda }_{k}}{\displaystyle\sum_{i=1}^{n}{\lambda }_{i}} (4)
    {e}_{\left(k\right)}=\dfrac{\displaystyle\sum_{i=1}^{k}{\lambda }_{i}}{\displaystyle\sum_{i=1}^{n}{\lambda }_{i}} (5)

    (5)根据累计贡献度 {e}_{\left(k\right)} 来确定降维后的主成分,对得到的主成分按大到小进行分类 {F}_{1} {F}_{2} ,…。主成分 {F}_{k} 的定义可以表示为式(6)。

    {F}_{k}={e}_{k1}{X}_{1}+{e}_{k2}{X}_{2}+\dots +{e}_{kn}{X}_{n}\quad k=\mathrm{1,2},\dots ,l (6)

    式中, {F}_{n} {F}_{m} (nm; n, m = 1, 2, …) 不相关,且 var( {F}_{n} ) > var( {F}_{m} ), n < m

    水质数据传感器类型不止一种,且监测的数据量较大,在众多的外界因素中,像水温、氨氮、总氮、电导率等变量与变量之间存在着一定的耦合性,过多的输入不仅不会提高预测的精度,反而会造成数据的冗余,使得数据难以收敛,大大增加了模型的训练时间。PCA方法可从原始数据中选择不同的线性组合,按其贡献大小来决定各种协方差进行判断,其更注重各因素的内部关系。使用PCA对影响变量进行降维可以降低数据维度、提高模型泛化能力、消除共线性。

    为了减少水质数据集中数据的冗余性以及变量的共线性,使用PCA方法对总氮进行预测的外部数据进行主成分分析,得到新特征的贡献率和累计贡献率如表2所示。

    表  2  总氮贡献率分析
    Table  2.  Analysis of total nitrogen contribution rate
    特征值贡献率累计贡献率
    161.811561.81159
    213.5610975.37268
    311.5372186.90989
    47.1087894.01867
    53.3947397.4134
    61.6233999.03679
    70.0883699.12515
    80.07955100
    下载: 导出CSV 
    | 显示表格

    主成分分析中的主成分载荷矩阵也称为成分得分系数矩阵,它表示了各个指标在不同主成分上的权重比例,反映了它们对于主成分的贡献程度[29]。这些成分得分系数通常是介于-1和1之间的实数,某个指标在某个主成分上的系数r越大,这意味着该指标在该主成分上具有更高的载荷,其与该主成分的相关性也越强[30]。对总氮的影响变量进行PCA处理,结果如表3所示。可以发现它们的影响变量的主成分F1F2F3的累计贡献率已经超过85%,表明这三个变量可以表达大部分影响变量的信息。从表3中可以看出,成分F1中,水温、电导率、氨氮和总氮4个水质指标相关系数最高;成分F2中,浊度和总磷的相关系数最高;成分F3中,pH和高锰酸盐的相关系数最高。同时,还可以发现三个成分相关性因素最高的几个变量正好是8个影响变量的总和,因此,在实际总氮预测中,可以将8个影响变量转换成3个新变量进行预测。

    表  3  总氮主成分得分系数
    Table  3.  Total nitrogen principal component score coefficients
    主成分 F1 F2 F3
    水温 −0.255 −0.066 0.188
    pH 0.026 −0.228 0.760
    电导率 0.250 −0.011 0.029
    浊度 −0.071 0.391 0.026
    高锰酸盐指数 −0.070 0.256 0.645
    氨氮 0.261 0.149 0.119
    总磷 −0.094 0.428 −0.059
    总氮 0.261 0.149 0.119
    下载: 导出CSV 
    | 显示表格

    基于PCA的CNN-LSTM水质预测模型框架如图3所示。整个模型框架由输入模块、处理模块、预测模块、分析模块四个部分构成。输入模块主要功能在于水质监测数据集的构建和数据的预处理;处理模块将数据集分为预测变量和影响变量,对影响变量中8个指标使用PCA进行降维处理;预测模块主要包括组合模型的超参数设定、特征提取、序列构建以及模型的训练及优化;而分析模块主要是对模型进行评估,其中包括指标评估和曲线评估两部分。

    图  3  基于PCA的CNN-LSTM水质预测方案
    Figure  3.  CNN-LSTM water quality prediction scheme based on PCA

    基于PCA的CNN-LSTM模型的流程主要包括:

    (1)数据预处理。主要是对原始水质序列进行缺失值填补和异常值剔除,并将其归一化,最后按照8:2的比例将其分成训练集和测试集。

    (2)数据降维。对影响变量使用PCA算法进行降维处理,在降低数维度的同时,消除变量之间的共线性。然后将上述分解和降维后的新序列放入CNN-LSTM模型中。

    (3)模型参数设定。首先设定LSTM网络神经元个数和步长,再通过控制变量法设定CNN网络卷积核个数和大小,经过多次的训练和测试得出可靠的预测模型。

    (4)反归一化。对输出结果进行反归一化,使之恢复到原来的数值区间。

    (5)模型评估。使用指标评估和曲线评估对当前模型和其他模型进行对比。

    整个流程如图4所示。

    图  4  基于PCA的CNN-LSTM预测流程图
    Figure  4.  Flow chart of CNN-LSTM prediction based on PCA

    本文首先从数据的角度出发,对影响变量进行降维处理,得到了三个新的变量F1、F2和F3,通过构建的新数据集,用于下一时刻数据的预测。通过控制变量法反复检测和设定不同的神经元个数,得出了部分模型参数的最优解,包括LSTM神经元个数以及CNN卷积核数量和大小。表4列出了这些参数的最优解。

    表  4  模型参数设置
    Table  4.  Model parameter settings
    参数类别总氮参数值
    训练次数100
    卷积核的数量16
    卷积核大小3
    LSTM神经元个数64
    预测步长1
    Adam优化算法0.001
    下载: 导出CSV 
    | 显示表格

    为了比较组合模型对实际数据的预测效果,使用了CNN-LSTM模型和基于PCA的CNN-LSTM模型两种模型。并在此基础上对两种模型的参数进行了优化,使得两个模型都具有最佳的预测性能。得到的部分预测曲线对比如图5所示。从图5中可以看出,改进后的模型在平稳序列期间拟合度方面更接近于实际值,且在出现峰值的情况下的波动误差更小,这是因为在进行降维之前,原始数据中包含大量重复无用的信息,这些信息会造成 CNN-LSTM模型完成多次无效的学习,从而降低了预测效果。因此,通过减少数据中的重复信息,可以提高模型的预测准确性。

    图  5  不同模型预测曲线比较
    Figure  5.  Comparison of prediction curves for different models

    为了评价模型的预测效果,本实验对预测结果分别使用了ARIMA模型、LSTM模型、CNN-LSTM模型使用MAE,MSE,RMSE、PCCs作为评价指标。同时,还添加了进行最新水质预测方法CEEMDAN-LSTM[31]和Bi - LSTM[32]进行比较,得到的预测结果如表5所示。

    表  5  总氮预测结果比较
    Table  5.  Comparison of total nitrogen prediction results
    模型选择RMSEPCCsMAEMSE
    ARIMA0.20530.92473.67230.0424
    LSTM0.18410.95742.97640.0341
    CNN-LSTM0.17510.95972.75640.0307
    CEEMDAN-LSTM0.16790.96462.66370.0282
    BiLSTM0.16530.96572.62830.0273
    基于PCA的CNN-LSTM0.16340.96672.60130.0267
    下载: 导出CSV 
    | 显示表格

    表5中可以看出,基于PCA的CNN-LSTM模型相对于CNN-LSTM模型在MAE、RMSE和MSE三种评价指标上都有了较大的提升。以总氮为例,其MSE提升了13%,RMSE提升了6.7%,MAE提升了5.6%。与ARIMA,LSTM和两种模型相比,基于PCA的CNN-LSTM模型各指标均有显著提高,其中MSE分别提升20.4%、11.2%,MAE分别提升38.5%、24.2%。此外,与最新提出的两种水质方法相比,基于PCA的CNN-LSTM模型的预测结果均表现得更加优秀。

    水质预测是水资源保护的重要手段。但因水质原始数据存在大量冗余信息,故利用CNN-LSTM模型进行学习时可能会出现大量低效误差。为此,提出一种基于Prophet模型与PCA的CNN-LSTM水质预测方法。首先在数据清洗过程中,采用Prophet模型进行异常值处理;其次使用PCA方法对影响变量进行降维,消除变量关联性;最后把处理结果作为CNN-LSTM模型输入,并对水质进行预测。把所提方法应用于总氮指标预测,实验结果表明:所提方法相对于CNN-LSTM模型在MAE、RMSE和MSE三种评价指标上都有了较大的提升,对总氮的预测PCCs达到0.96以上,可在实际水质预测中满足预测需求。

  • 图  1   缺失值处理后水质数据集(部分)

    Figure  1.   Water quality dataset after missing value processing (partial)

    图  2   总氮异常值检测结果

    Figure  2.   Total nitrogen anomaly detection results

    图  3   基于PCA的CNN-LSTM水质预测方案

    Figure  3.   CNN-LSTM water quality prediction scheme based on PCA

    图  4   基于PCA的CNN-LSTM预测流程图

    Figure  4.   Flow chart of CNN-LSTM prediction based on PCA

    图  5   不同模型预测曲线比较

    Figure  5.   Comparison of prediction curves for different models

    表  1   水质指标数据

    Table  1   Water quality indicator data

    指标名称数据个数取值范围缺失数据量
    溶解氧54521.787~23.84220
    水温54522.525~33.32520
    总氮54471.891~12.17325
    PH52537.1325~9.2975219
    电导率5254193.725~719.875218
    浊度48183~6712.13654
    高锰酸盐指数49731.636~11.62499
    氨氮51160~1.886125356
    总磷49730.014~0.526333499
    下载: 导出CSV

    表  2   总氮贡献率分析

    Table  2   Analysis of total nitrogen contribution rate

    特征值贡献率累计贡献率
    161.811561.81159
    213.5610975.37268
    311.5372186.90989
    47.1087894.01867
    53.3947397.4134
    61.6233999.03679
    70.0883699.12515
    80.07955100
    下载: 导出CSV

    表  3   总氮主成分得分系数

    Table  3   Total nitrogen principal component score coefficients

    主成分 F1 F2 F3
    水温 −0.255 −0.066 0.188
    pH 0.026 −0.228 0.760
    电导率 0.250 −0.011 0.029
    浊度 −0.071 0.391 0.026
    高锰酸盐指数 −0.070 0.256 0.645
    氨氮 0.261 0.149 0.119
    总磷 −0.094 0.428 −0.059
    总氮 0.261 0.149 0.119
    下载: 导出CSV

    表  4   模型参数设置

    Table  4   Model parameter settings

    参数类别总氮参数值
    训练次数100
    卷积核的数量16
    卷积核大小3
    LSTM神经元个数64
    预测步长1
    Adam优化算法0.001
    下载: 导出CSV

    表  5   总氮预测结果比较

    Table  5   Comparison of total nitrogen prediction results

    模型选择RMSEPCCsMAEMSE
    ARIMA0.20530.92473.67230.0424
    LSTM0.18410.95742.97640.0341
    CNN-LSTM0.17510.95972.75640.0307
    CEEMDAN-LSTM0.16790.96462.66370.0282
    BiLSTM0.16530.96572.62830.0273
    基于PCA的CNN-LSTM0.16340.96672.60130.0267
    下载: 导出CSV
  • [1] 张鼎渊. 基于EEMD-LSTM水质预测方法的研究与应用[D]. 合肥: 中国科学技术大学, 2021.
    [2]

    Wu J, Wang Z. A hybrid model for water quality prediction based on an artificial neural network, wavelet transform, and long short-term memory[J]. Water, 2022, 14(4): 610. DOI: 10.3390/w14040610

    [3] 王嫄嫄. 基于LSTM的水质预测方法研究[D]. 南京: 南京邮电大学, 2020.
    [4] 赵春兰, 李屹, 何婷, 等. 基于动态隶属度的模糊时间序列模型的水质预测研究[J]. 计算机工程与科学, 2022, 44(8): 1488-149. DOI: 10.3969/j.issn.1007-130X.2022.08.020
    [5] 王严. 基于LSTM多点位视图在线学习的水源地水质时间序列预测[D]. 南京: 南京邮电大学, 2023.
    [6] 杨坪宏, 胡奥, 崔东文, 等. 基于数据处理与若干群体算法优化的 GRU/LSTM水质时间序列预测[J]. 水资源与水工程学报, 2023, 34(4): 45-53.
    [7] 陈能汪, 余镒琦, 陈纪新, 等. 人工神经网络模型在水质预警中的应用研究进展[J]. 环境科学学报, 2021, 41(12): 4771-4782.
    [8] 褚飞飞. 基于注意力机制和长短期记忆神经网络的水质预测方法研究[D]. 南京: 南京邮电大学, 2023.
    [9] 吴雅楠. 基于优化BP神经网络的水质预测及工艺模糊推理研究[D]. 昆明: 昆明理工大学, 2023.
    [10] 魏坤鹏. 灰色预测和聚类融合理论在水质检测控制中的应用[D]. 天津: 天津工业大学, 2017.
    [11] 郭杨. 基于GM(1, 1)模型的河流水质主要指标预测研究[J]. 农业与技术, 2022, 42(19): 116-120.
    [12] 李恺. 基于灰色模糊模型对湖泊水质研究[D]. 天津: 天津大学, 2017.
    [13] 杨宇锋, 武暕, 王璐, 等. 基于随机森林模型的辽河高时间分辨率氮、磷浓度模拟与预测[J]. 环境科学学报, 2022, 42(12): 384-391.
    [14] 石晴宜, 董增川, 罗赟, 等. 基于机器学习方法的洪泽湖入湖水质评价及预测研究[J]. 中国农村水利水电, 2021(12): 53-59. DOI: 10.3969/j.issn.1007-2284.2021.12.009
    [15] 肖燚, 郭亚会, 李明蔚, 等. 基于机器学习的地下水水质预测研究[J]. 北京师范大学学报(自然科学版), 2022, 58(2): 261-268.
    [16] 袁涛. LSTM多要素水质预测模型及其在水质管理系统中的应用研究[D]. 杭州: 杭州电子科技大学, 2022.
    [17] 李文静, 王潇潇. 基于简化型LSTM神经网络的时间序列预测方法[J]. 北京工业大学学报, 2021, 47(5): 480-488. DOI: 10.11936/bjutxb2020120032
    [18]

    Tan W, Zhang J, Wu J, et al. Application of CNN and Long Short-Term Memory Network in Water Quality Predicting[J]. Intelligent Automation & Soft Computing, 2022, 34(3): 1943-1958.

    [19]

    Tan W, Zhang J, Liu X, et al. Dissolved Oxygen Prediction Based on PCA- LSTM[C]. Journal of Physics: Conference Series. IOP Publishing, 2022, 2337(1): 012012.

    [20] 孙龙清, 吴雨寒, 孙希蓓, 等. 基于IBAS和LSTM网络的池塘水溶解氧含量预测[J]. 农业机械学报, 2021, 52(S1): 252-260.
    [21] 中国环境监测总站. 国家地表水水质自动监测实时数据发布系统[DB/OL]. [2024-04-02]. https://szzdjc.cnemc.cn:8070/GJZ/Business/Publish/Main.html.
    [22] 环境专业知识服务系统. 数据服务[DB/OL]. [2024-04-02]. http://envi.ckcest.cn/environment/.
    [23] 王坤, 刘小杰, 刘二浩, 等. 基于AdaBoost算法的炉芯温度预测模型[J]. 钢铁研究学报, 2020, 32(5): 363-369.
    [24] 周玉, 朱文豪, 房倩, 等. 基于聚类的离群点检测方法研究综述[J]. 计算机工程与应用, 2021, 57(12): 37-45. DOI: 10.3778/j.issn.1002-8331.2102-0167
    [25]

    Ni W J, Shen Q L, Zeng Q T, et al. Data-driven Seeing Prediction for Optics Telescope: from Statistical Modeling, Machine Learning to Deep Learning Techniques[J]. Research in Astronomy and Astrophysics, 2022, 22(12): 125003. DOI: 10.1088/1674-4527/ac977b

    [26] 陈婷, 项兆坤, 徐金凯, 等. 查询优化器连接顺序评估[J]. 华东师范大学学报(自然科学版), 2022(5): 48-60.
    [27]

    López G, Arboleya P. Short-term wind speed forecasting over complex terrain using linear regression models and multivariable LSTM and NARX networks in the Andes Mountains, Ecuador[J]. Renewable Energy, 2022, 183: 351-368. DOI: 10.1016/j.renene.2021.10.070

    [28]

    Pearson K. Onlines and planes ofclosest fit tosystems ofpoints inspace[J]. Philosophical Magazine, 1901, 2(6): 559-572.

    [29] 帅春江, 聂翔, 何伟. 主成分法分析电磁辐照对茶毛虫生长发育的影响[J]. 陕西理工学院学报(自然科学版), 2014, 30(3): 63-67.
    [30] 张冬萍, 刘蓬, 刘琳, 等. 黄石市磁湖水质时空分布及污染源解析[J]. 环境工程技术学报, 2022, 12(2): 560-566. DOI: 10.12153/j.issn.1674-991X.20210679
    [31]

    Zhang L, Jiang Z, He S, et al. Study on water quality prediction of urban reservoir by coupled CEEMDAN decomposition and LSTM neural network model[J]. Water Resources Management, 2022, 36(10): 3715-3735. DOI: 10.1007/s11269-022-03224-y

    [32]

    Khullar S, Singh N. Water quality assessment of a river using deep learning Bi-LSTM methodology: forecasting and validation[J]. Environmental Science and Pollution Research, 2022, 29(9): 12875-12889. DOI: 10.1007/s11356-021-13875-w

  • 期刊类型引用(1)

    1. 林峰. 一种融合虚拟计量与卡尔曼滤波算法的智能水质预测方法. 计量与测试技术. 2024(12): 36-38 . 百度学术

    其他类型引用(0)

图(5)  /  表(5)
计量
  • 文章访问数:  278
  • HTML全文浏览量:  160
  • PDF下载量:  32
  • 被引次数: 1
出版历程
  • 收稿日期:  2024-04-01
  • 修回日期:  2024-05-22
  • 录用日期:  2024-04-21
  • 网络出版日期:  2024-06-18
  • 刊出日期:  2024-10-17

目录

/

返回文章
返回