论文题目 江河水流量预测的数学模型研究
学 院 数学与统计学院
专 业 数学与应用数学
年 级 2011级
学 号 201124091150
学生姓名 李连结
指导教师 刘得花
完成时间 2015 年 4 月
肇庆学院教务处制
江河水流量预测的数学模型研究
摘 要 根据历史江河流量数据,运用时间序列分析方法来建立江河流量预测的数学模型,使用MATLAB软件,使用时间序列模型中的趋势移动平均法、加权移动平均法、简单移动平均法,分别量化分析预测蕴含在江河历史水流量数据里的特征,建立了数学模型,对江河水流量作预测研究.结果表明,这些模型对江河流量的预测有较好的应用价值.
关键词 时间序列模型;简单移动平均法;加权移动平均法;趋势移动平均法
1引言
在经济现象和自然现象中,我们需要观测所要研究的某种现象,因为我们为了对某些系统或事物的运行规律探索其究竟,于是得到一定顺序的数据资料.我们经过分析这些资料跟数据,对系统或事物的以后发展进行控制或预测的方法,就是利用时间序列特征的一种分析方法.许多数据都是以时间序列的形式呈现的,如:广州城市每天的雾霾浓度每小时观测值序列,北京市出生婴儿数量的周度序列等等.相邻观测值之间的相互依赖性是时间序列固有的典型特征.使用时间序列分析预测江河水流量实际上就是讨论讨论这种水流量观测值相互依赖性的一种分析技术.
收集一条江河的历年的流量数据资料,根据这些相邻观测数据之间的相互依赖性,运用时间序列里的几种预测方法,就可对未来江河水流量做出预测.
2影响江河年径流量的因素分析
年径流量是指在一年时间里,通过某江河横断面的水的体积.河水年径流量随着时间变化而不断变化,江河水流量时间序列是按时间顺序生成的一系列观测值的集合.一个江河年径流量的平稳时间序列可以有效地描述它的均值、方差和自相关的函数.季节变动、周期循环变动等都会影响江河年径流量的变动趋势.
按时间的先后次序排列而成的数列,往往表现出某种随机性,彼此之间存在着统计上的依赖关系,这种数列受到各种偶然因素的影.我们可以运用时间序列的几种预测模型来揭示江河水流量的数据规律,进而进行江河水流量的预测,预测其未来范围大小,从而可为做好防洪抗洪工作提供帮助.
为了预测未来某江河的年径流量的数值,需要收集该江河历年的具体年径流量数值,以时间顺序排列,使之形成一时间序列,运用预测模型对未来的数值做出预测.
3 问题分析
3.1水流量时间序列的分解
3.1.1 长期趋势变动
虽然随机起伏的状态是时间序列一般会呈现出来的,可是递增、递减的变化或转变,较长的时间里仍会呈现的.这样的逐渐转变就是要研究的一个序列趋势,一般是长期因素的影响结果,好比近几年大学招生的人数的变化、某个国家的人口总量的变化、某保险公司保费收入的变化等等,长期趋势的影响是使得数据资料表现出一种未来会出现的上升或者是下降还是保持不变的一个情况.
3.1.2 循环波动
水流量的时间序列的以后的数值都不可能很精确地落在趋势线上,虽然江河水流量的时间序列可以显示出长期的趋势,其实它往往会围绕趋势线波动.
3.1.3 季节性变化【1】
季节的变动而是水流量时间序列表现出某种趋势运动.比如,每天的雾霾监测资料显示在一天内的“季节”情况,在上、下班拥挤时刻出现高数值监测指标,在一天的休息时刻和傍晚出现中等监测指.季节性变化的影响是水流量数据资料表现出因季节变化预测数值会出现不同.
3.1.4 随机波动
这里的江河水流量预测的不规则成分是由那些影响该序列的不重复出现的和不可预期的而且是短期的因素引起的.随机变动是不可以容易地预测的,原因是这种成分是用来说明江河水流量的时间序列中的随机变动.
4 用移动平均法预测江河水流量
用移动平均法预测江河水流量是根据江河水流量的时间序列逐渐推移,逐次计算包含一定项数的时序平均数,以反映江河水流量的长期变化趋势的方法.
用来预测江河水流量的移动平均法是有简单移动平均法预测法,加权移动平均法预测法,趋势移动平均法预测法等.
4.1 简单移动平均法【2】
设江河水流量的观测序列为 EMBED Equation.DSMT4 ,取移动平均的项数 EMBED Equation.DSMT4 .一次简单移动平均值计算公式为:
EMBED Equation.DSMT4 (1)
当水流量的预测目标的基本趋势是在某一水平上下波动时,可用一次简单移动平均方法建立江河水流量的预测模型:
EMBED Equation.DSMT4 (2)
其预测标准误差为:
EMBED Equation.DSMT4 EMBED Equation.KSEE3 \* MERGEFORMAT EMBED Equation.KSEE3 \* MERGEFORMAT (3)
最近N期水流量的序列值的平均值作为未来各期的水流量的预测结果。一般N取值范围: EMBED Equation.DSMT4 .当历史水流量的序列的基本趋势变化不大而且不规则变动部分较多时,N的取值应较大一些.
模型运用
2004年-2014年黄河的年径流量时间序列如表2所示.下面用一次简单移动平均法预测2015年的黄河年经流量.
表1 2004-5014的黄河年径流量(单位:亿立方米)
年份t
2004
2005
2006
2007
2008
2009
年径流量
533.8
544.6
545.5
550.1
551.0
554.2
年份t
2010
2011
2012
2013
2014
年径流量
555.3
560.4
558.4
562.3
564.5
(数据来源:《第一调查网》)
分别取 EMBED Equation.DSMT4 的预测公式
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4 时, EMBED Equation.DSMT4 ,标准误差为
EMBED Equation.DSMT4
EMBED Equation.DSMT4 时, EMBED Equation.DSMT4 ,标准误差为
EMBED Equation.DSMT4
计算结果表明,N=4时,水流量的预测的标准误差较小,所以选取N=4.预测2015年的黄河年径流量为561.4000亿立方米.
计算的MATLAB程序如下:
clc;cleary5=[533.8,544.6,545.5,550.1,551.0,554.2,55.3,560.4,558.4,562.3,564.5];m=length(y);n=[4,5]; %为移动平均的项数for i=1:length(n) for j=1:m-n(i)+1 yhat{i}(j)=sum(y(j:j+n(i)-1))/n(i); end y12(i)=yhat{i}(end); s(i)=sqrt(mean((y(n(i)+1:m)-yhat{i}(1:end-1)).^2));%标准差endy12,s
输出结果:
y12 =
561.4000 560.1800
s =
5.9740 7.1580
经MATLAB制作的趋势图如下:
图1 2004-5014的黄河年径流量
简单移动平均法预测江河水流量只能做近期的水流量预测,且是水流量预测目标的发展趋势变化不大的情形.如果存在其它影响因素的变化部分,就会出现大的预测偏差和滞后.
4.2 加权移动平均法
每年的河水流量数据所包含的信息量是不一样的,去年的水流量数据在预测来年江河水流量的数值上比前年的水流量数据更重要,更可靠.过去更久的数据的重要性就更低.如果把每年的水流量数据均等看待,赋予相同的权重就会出现大的偏差.近年的河水流量数据的重要性更大,对近几年的河水流量数据给予较大的权重,这就是用加权移动平均法预测江河水流量的缘由【3】
设河水流量时间序列为 EMBED Equation.DSMT4 加权移动平均公式为
EMBED Equation.DSMT4 (4)
EMBED Equation.DSMT4 为t期的水流量的加权移动平均数; EMBED Equation.DSMT4 是权数,说明相应的 EMBED Equation.DSMT4 在加权平均数中的重要性.
水流量的预测公式为
EMBED Equation.DSMT4 (5)
也就是说用第t期水流量加权移动平均数作为第t+1期的江河水流量的预测值.
模型运用
2005-2014年淮河的年径流量如表3所示,用加权移动平均法预测2015年淮河的年径流量.
表2 2005-2014年淮河的年径流量(单位:百亿立方米)
年份
2005
2006
2007
2008
2009
年径流量
6.35
6.20
6.22
6.66
7.15
三年加权移动平均预测值
6.235
6.4367
相对误差(%)
6.38
9.98
年份
2010
2011
2012
2013
2014
年径流量
7.25
7.24
7.26
7.28
7.20
三年加权移动平均预测值
6.8317
7.1183
7.2283
7.2517
7.2667
相对误差(%)
5.77
1.68
0.44
0.39
0.93
(数据来源:《第一调查网》)
取 EMBED Equation.DSMT4 ,按预测公式
EMBED Equation.DSMT4
计算三年加权移动平均预测值,其结果列于表2中.2015年淮河年径流量的预测值为(百亿立方米)
EMBED Equation.DSMT4
这个预测值偏低,可以修正。其方法是:算出每年预测值与实际值的相对误差,举例,2008年是
EMBED Equation.DSMT4
将相对误差列于表2中,算出总的平均相对误差
EMBED Equation.DSMT4
总预测值的平均值比实际值低3.34%,将2015年的预测值修正为
EMBED Equation.DSMT4
计算的 MATLAB 程序如下:
clc;cleary=[6.35,6.20,6.22,6.66,7.15,7.25,7.24,7.26,7.28,7.20];w=[1/6;2/6;3/6];m=length(y);n=3;for i=1:m-n+1 yhat(i)=y(i:i+n-1)*w;endyhaterr=abs(y(n+1:m)-yhat(1:end-1))./y(n+1:m)T_err=1-sum(yhat(1:end-1))/sum(y(n+1:m))y2015=yhat(end)/(1-T_err)
输出结果:
yhat =
6.2350 6.4367 6.8317 7.1183 7.2283 7.2517 7.2667 7.2367
err =
0.0638 0.0998 0.0577 0.0168 0.0044 0.0039 0.0093
T_err =
0.0334
y2015 =
7.4868
经MATLAB制作的趋势图如下:
图2 2005-2014年淮河的年径流量
的选择有一定的经验性.近年水流量数据的权数大,远期的小.那这里它至于大到什么的程度或者是小到什么的程度,要预测者对水流量序列的了解和分析来确定.
4.3 趋势移动平均法【4】
历年数据出现直线增加或减少趋势时, 用前面两种方法来预测就会出现滞后偏差.需进行修正,作水流量的二次移动平均, 利用水流量的移动平均滞后偏差的规律来建立直线趋势的预测模型. 这就是所使用的趋势移动平均法做江河水流量的未来预测问题.
一次移动的平均数为
EMBED Equation.DSMT4
水流量数据的二次移动平均计算公式为
EMBED Equation.DSMT4 (6)
这里设河水流量的时间序列 EMBED Equation.DSMT4 从某时期开始具有直线趋势,预测值也按这趋势发展,水流量的预测模型为
EMBED Equation.KSEE3 \* MERGEFORMAT (7)
其中t为当前时期数;m为由t至预测期的时期数; EMBED Equation.DSMT4 为截距; EMBED Equation.DSMT4 为斜率.两者又称为平滑系数.
由模型(7)可知
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
EMBED Equation.DSMT4
所以
EMBED Eq