--------“山东省交通发展指数”的构建及作用
许云飞
(山东省交通科学研究所,山东 济南 250031)
摘要:简要地介绍了“山东省交通发展指数“的构建过程,结合山东实际说明了“山东省交通发展指数”的实际应用及其重要意义,最后指出了该指数目前还存在的问题。
关键词:指数 交通
随着交通建设的突飞猛进,国民经济综合部门和交通管理规划部门亟需动态了解交通和经济之间的比例关系,把握交通发展的脉搏、以便加强宏观调控,提高决策水平,使经济和交通保持合理的速度协调发展。
为了达到上述目的,一个首要的命题是构建一个能表征交通发展状态的数。交通部有关单位曾经研究过交通GDP,但是由于存在重复计算很难分解、即便是分解出来也很难分解应用的难题,所以,已被实践证明此路不通。
为此,我们决定另换思路,构建“交通发展指数”。该指数既可以反映交通发展状态,又可以反映交通发展的历史进程。通过它,既能方便交通行业自身的比较和鉴别,还便于和国民经济及其它经济部门进行比较和鉴别,从而能迅速有效地了解和发现交通和社会经济中存在的问题,及时决策和调控,以保持交通和社会经济发展的的适应性。
这个梦想现在已经变成现实。山东交通科研所承担的《山东省交通运输发展经济指数的研究》课题日前通过了高级专家的鉴定,达到了国内领先水平。
一、研究的指导思想和技术路线
课题组依据系统论认为交通行业是一个系统,因此平常用来表征交通发展状态的众多指标间一定有一个统一的“事物”在起作用。按照马克思主义的认识论,只要存在这个“事物”,用系统论的思想指导,循着系统的轨迹,经过不懈的努力,就一定可以了解他、掌握它。
课题组研究的技术路线可演绎为:1、选择交通特征量。2、收集交通特征量的原始数据,并对原始数据进行同性化和标准化处理。3、运用国际上通用的SAS软件对交通特征量进行主成份分析。4、科学地组合出能包含交通特征量绝大部分信息的一个“数”。5、对上述的“数”进行标准化处理,建立以1980、1990和1996年为基准的“交通发展指数”。6、探讨“交通发展指数”的作用和意义。需要说明的是,郁于我们的条件,我们的研究以山东的数据为范例进行。各省市只要换以自己地域的数据,就可求得本地域的交通发展指数。
二、“山东省交通发展指数”的构建
首先,依据《中国统计年鉴》、《中国交通年鉴》、《山东统计年鉴》、《山东地方交通统计资料》,我们罗列了几乎所有有关的交通统计参数,一共有40余个。然后,我们把明显属于导出的或者是已被其他指标覆盖的参数,如公路网总里程已经包含的三级公路里程、四级公路里程、等外公路里程等去掉,还剩26个。他们是:公路网总里程,高速公路总里程,二级以上公路里程,通达率,铺面率,好路率,绿化率,民用汽车拥有量,沿海港口吞吐量,内河港口吞吐量,民用船总吨位,内河航道通航里程,综合运输客运量,公路客运量,水运客运量,综合运输客运周转量,公路客运周转量,水运客运周转量,综合运输货运量,公路货运量,水路货运量,综合运输货运周转量,公路货运周转量,水运货运周转量,每万车死亡人数,每万船吨位死亡人数。
高速公路到1992年才有数值,1980至1991这段时间均为0值,对此,我们曾采取过好几种处理方法,都因结果失真太大而失败。最后,我们通过用“公路网当量总里程”代替“公路网总里程”和“高速公路总里程”的综合信息,问题才获得较好的解决。这样,特征量就变成了25个。经分析,这些量中尽管还存在互相有涵盖的情况,但保持了最大的完整性。因此,我们把这25个全部作为“交通特征量”。对这些“交通特征量”,我们收集了它们1980年至2000年的全部历史资料,形成交通特征量原始数据矩阵。
1)同性化处理
同性化处理是针对参数的不同极性取向而言的。极性取向分正极性和负极性,通俗地讲,随着量值增大指标性质趋优的为正极性,反之为负极性。同性化处理就是通过对指标意义的调整,使所有指标的极性均为正极性。
经分析,在所选择的“交通特征量”中,原来反映道路运输和海上运输安全的两个指标“每万车死亡人数”和“每万吨位船死亡人数”是负极性的,为了保证交通特征量全部为正极性,我们把它转化为“每车安全人数”和“每千吨安全人数”。
2)标准化处理
这里的“标准化处理”包含两个内容:第一是无量纲处理。这是进行数据分析前必须的处理环节。第二是形成指数。即让所有年份的值都转变为某年为起点的相对数。针对上述要求,我们是通过对每一个参数都除以某一基准年的值来解决的。遵照交通厅有关部门和领导的指示,为了方便后续的分析研究,我们选了三个基准年,它们是1980、1990和1996年。其中,以1980年为基准年的标准化处理结果。
3)主成份分析
主成份分析又称主分量分析,它的突出作用有两个:第一是把原来不线性独立的变量转化为同样数量的、由原变量线性组合而成的、互相线性独立的变量,每一变量称为“主成分或主分量(principal component);第二是虽然生成的主分量在数量上和原变量一样多,但实际上第一主成分就会包含了原数据中尽可能多的变量信息,通常情况下,前两个或前三个主成分的累加就几乎包含了原数据90%以上的信息。除此以外,几个主成分还可以通过它们各自的特征值加权累加成为一个综合的数值。所以主成份分析可把高维的复杂变量简化为低维的简单变量,最后概括为一个变量。
主成分分析的输入数据,可以是协方差矩阵,也可以是相关矩阵。在本研究中,为了避免方差大的变量在主成分生成中作用大的问题,我们选择以相关矩阵为基础的主成分分析。
在主成分分析前,我们先对25个交通特征量进行相关分析。相关分析结果表明,公路网当量总里程与二级以上公路里程高度相关,客运总量、公路客运量、客运周转总量和公路客运周转量高度相关,货运总量、公路货运量、民用汽车拥有量和公路货运周转量高度相关。据此,我们在交通特征量中舍去二级以上公路里程、客运总量、公路客运量、客运周转总量、货运总量、公路货运量和民用汽车拥有量等7个参数,使交通特征量形成18个变量、21个观察值的新矩阵。
以这个18×21矩阵为基础,我们用国际上通用的SAS软件进行主成份分析计算,分析结果见表1
表1: Eigenvalues of the Correlation Matrix
特征值 相关矩阵
Eigenbalue Difference Proportion Cunulative
主成分 特征值 差分 信息包含率 累计信息包含率
PRIN1 13.1862 11.2159 0.732565 0.73257
PRIN2 1.9702 1.0598 0.109457 0.84202
PRIN3 0.9104 0.0664 0.050579 0.89260
PRIN4 0.8440 0.3478 0.046891 0.93949
PRIN5 0.4963 0.1893 0.027570 0.96706
PRIN6 0.3070 0.2040 0.017054 0.98412
PRIN7 0.1030 0.0338 0.005723 0.98984
PRIN8 0.0692 0.0186 0.003846 0.99368
PRIN9 0.0506 0.0250 0.002812 0.99650
PRIN10 0.0257 0.0109 0.001426 0.99792
PRIN11 0.0147 0.0056 0.000818 0.99874
PRIN12 0.0091 0.0029 0.000505 0.99925
PRIN13 0.0062 0.0018 0.000345 0.99959
PRIN14 0.0044 0.0030 0.000246 0.99984
PRIN15 0.0015 0.0008 0.000081 0.99992
PRIN16 0.0007 0.0001 0.000038 0.99996
PRIN17 0.0006 0.0004 0.000033 0.99999
PRIN18 0.0002 . 0.000012 1.00000
从表1可知,18个主成份中,主成份1(prin1)就包含了全部信息的73.26%。按一般的规则,只要选取特征值大于1的主成分就可以了,即以表1的特征值而言,只取主成分1和主成分2(特征值为13.1862、1.9702)就可以了,其累计包含信息率已达84.2%。我们为力求准确,决定以累计包含信息率99%位阀值,所以,我们选了主成份1、2、3、4、5、6、7、8,共8个,虽然计算增加了难度,但累计包含信息率达到了99.37%的高精度值。
4)“山东省交通发展指数”的构建
通过SAS软件,我们可得到18个交通特征量线性组合成个主成分的结构参数。主成分1~8的线性组合结构系数见表2所示。
表2:交通特征量主成分结构系数表
|