灰色聚类分析方法介绍
山东省交通科研所 许云飞
【提要】本文介绍了灰色聚类分析方法的原理、特点和优点,并通过一实例向大家展示了该分析方法的全过程,。
主题词:灰色理论 关联分析 灰色聚类
一、引 言
所谓聚类分析,是按照一定的标准对研究对象进行分类的数学方法,聚类分析是软科学研究的重要基础和有效手段。聚类分析的方法有好多种,如最短距离法、最长距离法、中间距离法、重心法、类平均法、可变类平均法、可变法、离差平方和法等等,灰色聚类法则是以灰色关联度为基础的聚类方法。这种方法具有不要求待分析序列有某种特殊的分布、计算过程简单、可以得到较多的信息等优点。笔者自行编写了计算机程序,已在多个研究课题中运用,效果很好。本刊1998年第二期、1999年第一期所发表的笔者有关《中国和山东经济及社会发展水平的定位》的两篇文章中都应用了这个方法,因此有些读者要求笔者对此进行详细的介绍,现撰写本文以飨读者,希望大家通过阅读这篇文章后能够掌握这种方法,在自已的实际工作中进行应用。
二、灰色关联度
在应用关联度方法处理实际问题时,X0序列常按某种要求而建立。例如分析某一系统的经济效益优劣,则X0序列可由Xi序列中同一性质元素中的最优者构成(也称为理想解);若要考察Xi序列与某一特定序列间的关联度,则可取该特定序列为X0序列(例如多元相关分析)。
2、计算示例
为了帮助大家理解上述模型和计算过程,举一简例:
①原始数据:
假如我们要对1995年辽宁、山东、江苏、浙江、福建和广东等沿海六省的交通系统工业企业的情况进行综合评判,原始数据见表1所示:(97中国交通年鉴601页)
表格 1 :示例原始数据
|
人均工业总产值 |
人均工业增加值 |
人均利润 |
人均所得税 |
辽宁 |
36.8765 |
7.4144 |
1.1346 |
0.3144 |
山东 |
57.8263 |
27.2660 |
1.9270 |
0.6817 |
江苏 |
65.2126 |
12.7578 |
-0.1123 |
0.2339 |
浙江 |
58.2558 |
13.3316 |
-0.4565 |
0.2939 |
福建 |
12.7170 |
4.8123 |
-0.7099 |
0.0451 |
广东 |
572.1891 |
90.9385 |
-33.5522 |
0.7437 |
②原始数据预处理:
为去掉负号,对“人均利润”指标一列全部加34,得新的数据表,见表格2:
表格 2:示例原始数据经预处理后的值
|
人均工业总产值 |
人均工业增加值 |
人均利润 |
人均所得税 |
辽宁 |
36.8765 |
7.4144 |
35.1346 |
0.3144 |
山东 |
57.8263 |
27.2660 |
35.9270 |
0.6817 |
江苏 |
65.2126 |
12.7578 |
33.8877 |
0.2339 |
浙江 |
58.2558 |
13.3316 |
33.5435 |
0.2939 |
福建 |
12.7170 |
4.8123 |
33.2901 |
0.0451 |
广东 |
572.1891 |
90.9385 |
0.4478 |
0.7437 |
对本例表2的数据显然均是值越大越好的效益指标。我们采用线性变换的方法进行预处理,处理结果见表3所示
表格 3