我的论文

“山东省交通发展指数”的构建及应用

2006-03-21    浏览次数:2388    返回列表

“山东省交通发展指数”的构建及应用

 

许云飞

山东省交通科学研究所、山东省济南市无影山中路38号、Emailxyfd@xyfd.com

 

  介绍了“山东省交通发展指数“的构建过程,结合山东实际说明了“山东省交通发展指数”的实际应用及其重要意义,最后指出了该指数目前还存在的问题。

 

关键词指数  交通

 

随着社会、经济和交通建设的突飞猛进,国民经济综合部门和交通管理规划部门亟需认清交通和经济之间的关联关系,把握交通发展的规律、以便加强宏观调控,提高决策水平,使社会、经济和交通保持合理的速度协调发展。

为了达到上述目的,一个首要的命题是能够构建一个“交通发展指数”。该指数既可以反映交通发展状态,又可以反映交通发展的历史进程。通过它,既能方便交通行业自身的比较和鉴别,还便于和国民经济及其它经济部门进行比较和鉴别,从而能迅速有效地了解和发现社会、经济和交通发展中存在的问题,及时决策和调控,以保持山东交通和社会经济发展的的适应性。

下面,我以山东为实例,谈一下解决这个问题的过程和意义。

1.“山东省交通发展指数”的构建

1.1.选择交通特征量

首先,依据《中国统计年鉴》、《中国交通年鉴》、《山东统计年鉴》、《山东地方交通统计资料》,我们罗列了几乎所有有关的交通统计参数,一共有40余个。然后,我们把明显属于导出的或者是已被其他指标覆盖的参数去掉,还剩公路网当量总里程,通达率,民用汽车拥有量,沿海港口吞吐量,民用船总吨位,综合运输客、货运量、综合运输客、货运周转量,每万车死亡人数,每万船吨位死亡人数等25个。这些量中尽管还存在互相有涵盖的情况,但保持了最大的完整性。我们把这25个作为“交通特征量”,收集了它们1980年至2000年的全部历史资料,形成交通特征量原始数据矩阵。

1.2.原始数据的同性化、标准化处理

同性化处理是针对参数的不同极性取向而言的,随着量值增大指标性质趋优的为正极性,反之为负极性。同性化处理就是通过对指标意义的调整,使所有指标的极性均为正极性。在所选择的“交通特征量”中,原来反映道路运输和海上运输安全的两个指标“每万车死亡人数”和“每万吨位船死亡人数”是负极性的,我们把它转化为“每车安全人数”和“每千吨安全人数”。

标准化处理包含两个内容:第一是无量纲处理,第二是形成指数,即让所有年份的值都转变为某年为起点的相对数,我们通过对每一个参数都除以某一基准年的值来解决。我们选了三个基准年,它们是198019901996年。

1.3.主成份分析

主成份分析又称主分量分析,它的突出作用有两个:第一是把原来不线性独立的变量转化为同样数量的、由原变量线性组合而成的、互相线性独立的变量,每一变量称为“主成分或主分量(principal component);第二是虽然生成的主分量在数量上和原变量一样多,但实际上第一主成分就会包含了原数据中尽可能多的变量信息,通常情况下,前两个或前三个主成分的累加就几乎包含了原数据90%以上的信息。除此以外,几个主成分还可以通过它们各自的特征值加权累加成为一个综合的数值。所以主成份分析可把高维的复杂变量简化为低维的简单变量,最后概括为一个变量。

主成分分析的输入数据,可以是协方差矩阵,也可以是相关矩阵。在本研究中,为了避免方差大的变量在主成分生成中作用大的问题,我们选择以相关矩阵为基础的主成分分析。

在主成分分析前,我们先对25个交通特征量进行相关分析。依据相关分析,我们在交通特征量中又舍去二级以上公路里程、客运总量、公路客运量、客运周转总量、货运总量、公路货运量和民用汽车拥有量等7个参数,使交通特征量形成18个变量、21个观察值的新矩阵。

以这个18×21矩阵为基础,我们用SAS软件进行了主成份分析计算,分析结果见表1

1:              Eigenvalues of the Correlation Matrix

                   Eigenbalue   Difference     Proportion      Cunulative

PRIN1             13.1862            11.2159             0.732565             0.73257

PRIN2             1.9702             1.0598              0.109457             0.84202

PRIN3             0.9104             0.0664              0.050579             0.89260

PRIN4             0.8440             0.3478              0.046891             0.93949

PRIN5             0.4963             0.1893              0.027570             0.96706

PRIN6             0.3070             0.2040              0.017054             0.98412

PRIN7             0.1030             0.0338              0.005723             0.98984

PRIN8             0.0692             0.0186              0.003846             0.99368

PRIN9             0.0506             0.0250              0.002812             0.99650

PRIN10            0.0257             0.0109              0.001426             0.99792

PRIN11            0.0147             0.0056              0.000818             0.99874

PRIN12            0.0091             0.0029              0.000505             0.99925

PRIN13            0.0062             0.0018              0.000345             0.99959

PRIN14            0.0044             0.0030              0.000246             0.99984

PRIN15            0.0015             0.0008              0.000081             0.99992

PRIN16            0.0007             0.0001              0.000038             0.99996

PRIN17            0.0006             0.0004              0.000033             0.99999

PRIN18            0.0002           .                      0.000012             1.00000

 

从表1可知,18个主成份中,主成份1prin1)就包含了全部信息的73.26%。按一般的规则,只要选取特征值大于1的主成分就可以了,即以表1的特征值而言,只取主成分1和主成分2(特征值为13.18621.9702)就可以了,其累计包含信息率已达84.2%。我们为力求准确,决定以累计包含信息率99%位阀值,所以,我们选了主成份12345678,共8个,虽然计算增加了难度,但累计包含信息率达到了99.37%的高精度值。

1.4.“山东省交通发展指数”的构建

通过SAS软件,我们可得到18个交通特征量线性组合成8个主成分的结构参数见表2所示。

2:交通特征量主成分结构系数表

交通特征量

主成分1

主成分2

主成分3

主成分4

主成分5

主成分6

主成分7

主成分8

公路网当量总里程

0.267098

-.127486

0.011834

-.015587

-.140459

0.100688

0.276917

0.197474

通达率

0.270522

-.006678

-.089069

-.013139

-.055508

0.112684

-.035895

-.106179