时间序列分析课程设计报告(1) - 图文

2025-09-30

中国铁路客运量的时间序列分析

辜予薇 1303050225 统计0502

中南大学数学院统计系 时间序列分析课程设计

摘要

首先,本文对中国铁路客运的现状及影响客运量的因素作了简要的分析,并说明了运用时间序列分析方法对中国铁路客运量作预测的现实意义。

接下来,文中收集到了从2002年1月至2008年10月中国铁路客运量的数据,经过一系列分析,对野值进行了相应的替换,并通过平稳化和零均值化将原序列转化为适宜建立时间序列模型的新序列X。

然后,本文用Box-Jekins方法对序列X进行初步识别,拟合出基本模型,并使用F检验定阶法和最佳准则函数定阶法确定模型的阶数,建立了AR(1)模型。

其后,本文还使用Pandit-Wu方法建立起了ARMA(4,3)模型,并将此模型与之前的AR(1)模型作了简单的对比。

在模型建立后,本文分别用两个模型进行了内插和外推预测,比较了它们的预测误差,最后肯定了ARMA(4,3)模型的优越性,并对预测结果进行了简单的分析,提出了自己的建议。

关键词 平稳化 Box-Jekins F检验 最佳准则函数 Pandit-Wu 预测

1

中南大学数学院统计系 时间序列分析课程设计

1 引言

铁路由于具有运距长、全天候、安全性强、运能大、受自然铁条件影响小的优点,在众多的交通工具中具有得天独厚的优势,无论在货运和客运上,都受到社会公众的亲睐。[1]而铁路客运又是我国交通运输体系中与老百姓联系最紧密的运输方式,无论远赴他乡的学子,还是行色匆匆的打工仔,都于长长的列车有着不解之缘。

而我们知道,在高峰时期购票难的问题一直困扰着广大的出行者,现时值春运,国家和有关部门及时获取信息,有效地统筹安排铁道和列车资源就显得尤为重要。

我们认为,在众多的信息中,打算乘火车出行的人数是一个关键,它直接关系着有关部门需要开派多少车的问题。如果车派少了,必然有部分的出行者由于无法买到车票而耽误行程,造成社会公众的不满;但另一方面,如果开派的列车数超过了实际需要,就会有过度“不满员”的情况,不仅加大了列车的运行成本,还造成了资源的浪费。

但由于有关部门也不可能精确地知道未来究竟有多少人打算乘火车出行, 所以只有根据历史的规律结合当下的实际情况进行预测。时间序列分析正是这样一种立足于历史,以预测和控制未来现象的方法,在处理这个问题上是有一定的可行性的。

2 问题分析

从理论上来讲,影响一个时期铁路客运量的因素有很多,我认为最重要的应该有下面几个:

A:节假日分布。一般来讲,节假日分布密集的时期的出行的人数会较一般时段有所增加,如春节前后主要是农民工和学生构成强大的客流,而“五一”和“十一”黄金周外出旅游的人也会大大增加铁路客运压力。

B:外部竞争因素。这主要是指飞机和汽车等交通工具的票价高低。如果某一时段飞机票价居高不下,而一些时间较充裕或购买力不够强的旅客则会选择乘

2

中南大学数学院统计系 时间序列分析课程设计

火车出行;另一方面,一般短途旅客都偏好于乘坐汽车,因为较方便。但如果此时的火车票价远低于汽车票价,使旅客感觉到乘坐火车的期望效用较高,便会舍弃汽车这种交通方式。

C:整个宏观经济环境。虽然这不是一个关键的因素,但是也在很大程度上影响了客流量。举例来说,在经济不景气的时期,各行各业会缩减其业务量,那么外出公干的人员自然会减少,而这一部份人也是构成客流量的因素,即铁路客流量也会较往常减少。

当然,还有很多的因素会影响铁路客流量,如个人偏好,天气状况等,但它们对铁路客运量的影响较之前的三个因素就较小,这里便不再作具体的分析。

而我们可以看到,因素A即节假日分布对客运量的影响相对稳定,也是具有一定周期性的。对此,我们可以了解它的周期,并且建立ARMA模型对客运状况进行分析,对未来的客运量进行预测,解决我们在前面提到的问题。

3 数据的收集

为了增加分析的准确性,我们需要将数据的统计时期精准到月。在中华人民共和国统计局网站[2]上,我们可以找到2002年1月至2008年10月的中国全社会客货运输量的月度报表,而其中就有一项就是铁路客运量。经过整理,可以得到中国铁路客运量的月度时间序列数据(见附录1)。

4 数据预处理

4.1 数据的录入

(1)创建Workfile:点击File/New/Workfile,输入起始年2002年,终止年2008年,并选择Frequency下拉菜单中的Monthly。

(2)建立object输入数据:点击object/new object,定义数据文件名Y并逐个录入数据。

4.2 画时序数据图:将序列Y(单位为亿人)1打开为列表,点击Workfile中的

1

以后无如特别说明,所有序列单位都为亿人

3

中南大学数学院统计系 时间序列分析课程设计

View/line graph,可以得到下面的图形

1.61.41.21.00.80.60.40.22002200320042005Y200620072008 图4.1 客运量的时间序列图

观察上图,我们看到2003年5月的Y值偏离其它点的距离较大,初步怀疑它为离群点。下面计算Y序列的均值和方差:

1210864200.40.60.81.01.21.4Series: YSample 2002M01 2008M12Observations 82Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis Jarque-BeraProbability 0.980000 0.960000 1.410000 0.330000 0.190626-0.148252 3.727568 2.109006 0.348365 图4.2 Y序列的均值与方差

从图4.2中可以得到Y?0.98,S(Y)?VAR(Y)?0.19,而2003年5月这个

4


时间序列分析课程设计报告(1) - 图文.doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:江西版信息技术四年级上册教案

相关阅读
本类排行
× 游客快捷下载通道(下载后可以自由复制和排版)

下载本文档需要支付 7

支付方式:

开通VIP包月会员 特价:29元/月

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:xuecool-com QQ:370150219