基于支持向量机的沼气中CH4浓度预测
,U2相比,更能体现CH4和CO2对其特征光子吸收的程度;同样组分的沼气混合气,温度不同时,传感器的几个通道输出不在同一数域。鉴于SVM善于解决小样本、非线性问题,及其好的泛化能力,把温度T,U1/Ur,U2/Ur,作为支持向量机的三维输入,建立CH4浓度的SVM预测框图,如图3所示。SVM的输出为CH4浓度的预测值。
SVM常用的核函数有多项式、径向基函数(RBF)、Sigmoid等。其中,Gauss径向基函数能比较好地模拟光谱信号的谱峰等特征信息,故选用RBF核函数。SVM的参数有σ2和γ,σ2取值过大,将使模型过早收敛;γ控制对超出误差的样本的惩罚程度。用反复试验的方式选取(σ2,γ),建立模型后,将测试样本的T,U1/Ur,U2/Ur代入模型进行计算,比较模型预测值与试验标定值,直到满足模型预测精度要求。本文最终确定σ2=10 000,γ=1。
3.2 结果与分析
在获得的693个样本中,随机选择543个作为训练样本,150个作为检验样本。将本文方法与线性插值法(Liner Interpolation,L-I)、多元回归法(Multiple Regression,M-R)、BP神经网络、RBF神经网络、未把温度作为支持向量机(SVM-noT)输入几种方法做比较,这些方法具体如下:
(1)线性插值法:由已知点(x01,y01),(x02,y02),…,(xon,y0n),依照空间线性关系建立y=A·x模型(A为系数矩阵),求解x11,x12,…,x1n所对应的y11,y12,…,y1n;
(2)多项式回归法:由已知点(x01,y01),(x02,y02),…,(x0n,y0n),依照最小二乘原则建立y=f(x)多项式模型,进而求解x11,x12,…,x1n所对应的y11,y12,…,y1n;
(3)BP神经网络法:基于误差反向传播算法的多层前向神经网络,建立已知样本的输入、输出模型。本文以温度T,U1/Ur,U2/Ur为输入,CH4的预测浓度为输出建立BP神经网络模型;
(4)RBF神经网络法:即以函数逼近理论为基础、传递函数为径向基函数的一类前向神经网络,可以在多维空间中拟合最佳模型。本文以温度T,U1/Ur,U2/Ur为输入,CH4的预测浓度为输出建立RBF神经网络模型;
(5)SVM-noT法:不考虑温度因素的影响,即在图3中去掉"SVM模块"前端的"温度T"输入,只保留U1/Ur,U2/Ur两元输入,建立输入、输出模型。
测试时,把x1j作为上述五种方法建立模型的输入,输出为CH4的预测浓度,可以检验这些模型的精度,其中向量xij=[T,U1/Ur,U2/Ur],i=0,1;j=1,2,…,n;x0j为训练样本,x1j为测试样本,
为预测浓度。将本文考虑温度的SVM方法与前五种方法进行对比时,是以预测结果的最大误差绝对值和误差绝对平均来衡量的。六种方法的仿真结果对比如图4所示。
从图中可以看出:SVM优于M-R,RBF,BP,L-I和SVM-noT法,误差最小,取得了最好的预测精度。SVM模型的核函数能更好地模拟光谱信号的谱峰等特征信息,能充分考虑到沼气中其他成分对CH4通道输出的影响,实现U1/Ur,U2/Ur,温度T对CH4浓度值更好地非线性映射,具有更好的泛化能力。
4 结论
针对沼气中CH4浓度的预测问题构建了实验系统,获取了大量实验数据,探讨了将温度T,CH4和CO2探测器的输出作为SVM的输入,预测CH4浓度的方法,将该方法与常用的L-I,M-R,BP,RBF,SVM-noT五种方法进行对比。实验结果表明,本文方法具有较高的预测精度,为沼气中CH4浓度的预测提供了一个良好的思路。
- 支持向量机语音识别算法在OMAP5912上的移植(07-23)
- 基于支持向量机的无人机视觉障碍检测(04-05)
- 基于改进遗传算法的支持向量机特征选择(02-05)
- GSM-R系统电磁环境的测试解决方案(01-09)