内容简介
《知识发现与智能决策》介绍知识发现、人工智能、数据仓库、联机分析处理和智能决策
的基本概念与相关理论基础; 分析知识发现与数据挖掘的对象与模式; 综
述数据预处理的作用和方法; 深入探讨基于符号推理的数据挖掘方法、基
于信息论思想的数据挖掘方法、基于进化思想的数据挖掘方法、基于集合
论的数据挖掘方法和基于统计分析的数据挖掘方法, 并将实例融入算法的
具体应用; 阐释智能决策支持系统, 并对数据库与数据库管理系统、模型
库与模型库管理系统、方法库与方法库管理系统、知识库与知识库管理系
统以及人机对话管理系统进行详细说明, 提出系统的逻辑框架和实现方
案; 给出知识发现与智能决策支持系统的应用案例.
目录
第1章绪论1
1.1知识发现1
1.2人工智能13
1.3智能决策23
第2章相关基础理论30
2.1知识发现的理论基础30
2.2数据仓库的理论基础43
2.3联机分析处理的理论基础62
2.4智能决策的理论基础69
第3章知识发现和数据挖掘对象与模式78
3.1知识发现的挖掘对象78
3.2知识发现的挖掘模式84
第4章数据预处理103
4.1数据预处理的作用103
4.2数据预处理的方法105
4.3数据离散化方法118
第5章基于符号推理的数据挖掘方法125
5.1BACON系统125
5.2FDD系统128
第6章基于信息论思想的数据挖掘方法143
6.1ID3方法143
6.2IBLE方法149
第7章基于进化思想的数据挖掘方法158
7.1神经网络158
7.2遗传算法170
7.3人工免疫算法186
7.4蚁群算法192
7.5鱼群算法202
7.6粒子群优化算法209
第8章基于集合论的数据挖掘方法217
8.1模糊集合217
8.2粗糙集合221
8.3粗糙集合的扩展模型229
第9章基于统计方法的数据挖掘方法248
9.1相关分析和回归分析248
9.2方差分析254
9.3因子分析262
9.4判别分析267
第10章智能决策支持系统275
10.1智能决策支持系统概述275
10.2数据库与数据库管理系统289
10.3模型库与模型库管理系统296
10.4方法库与方法库管理系统304
10.5知识库与知识库管理系统310
10.6人机对话管理系统318
10.7逻辑框架及实现方案331
第11章知识发现与智能决策支持系统的应用案例335
11.1知识发现的应用335
11.2智能决策支持系统的应用364
11.3数据挖掘系统产品378
参考文献385
摘要与插图
第1章绪论1.1知 识 发 现
在许多领域中,随着数据的不断增多,一些大型数据库的规模已经远远超过人工所能分析的程度,因此数据库和知识发现(knowledge discovery in database,KDD)技术应运而生(李嶶和李宛州,2001)。知识发现也是市场竞争的需要,它为决策者提供重要的、的信息或知识,从而产生不可估量的效益。
1.1.1知识发现的历程
随着数据库系统的广泛开发和数据库技术的迅速发展,数据以的速度大量聚集在计算机中,但与之相配合的数据分析和知识提取技术在相当长一段时间里没有大的进展,使得存储的大量原始数据没有被充分利用,没有转化成为指导生产的“知识”,而是出现了“数据的海洋,知识的荒漠”这样一种奇怪的现象。于是,知识发现在这种背景下应运而生,并很快发展成为上数据库和信息决策领域沿的研究方向之一。
知识发现的研究经历了从机器学习到机器发现再到知识发现几个阶段,从20世纪80年代末,人们开始研究知识发现,1989年8月在美国底特律召开的第11届人工智能联合会议的专题讨论会上次出现知识发现这个术语,法耶兹(Fayyad)次给出了知识发现的定义“知识发现是从数据集中识别出有效的、新颖的、潜在有用的,以及可理解的模式的非平凡过程”。随后在1991年、1993年和1994年都举行了知识发现专题讨论会,集中讨论海量数据分析算法、数据统计、知识表达、知识运用等问题。随着知识发现在学术界和工业界的影响越来越大,知识发现组委会于1995年把专题讨论会更名为会议,并改为大会代表自愿报名参加。1995年在加拿大蒙特利尔市召开了第一次知识发现学术会议,以后每年召开一次。
1.1.2知识发现的内容
在知识发现′96会议上对知识发现做了如下定义:知识发现是识别出存在于数据库中有效的、新颖的、具有潜在效果的乃至可理解的模式的非平凡过程。知识发现是将数据变成信息、信息变为知识、知识形成策略、策略构成智能的活动,从而指导人类有效地分析问题和解决问题。知识发现过程从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出积极的贡献。
知识发现的范围广泛,可以是经济、工业、农业、军事、社会、商业、科学、医疗卫生等的数据或卫星观测得到的数据。数据的形态有数字、符号、图形、图像、声音等。数据组织方式也各不相同,可以是结构化、半结构化、非结构化的。知识发现的结果可以表示成各种形式,包括规则、法则、科学规律、方程或语义网络等。
数据库知识发现的研究活跃。在法耶兹的定义中,涉及几个需要进一步解释的概念:“数据集”、“模式”、“过程”、“有效性”、“新颖性”、“潜在有用性”和“可理解性”。数据集是一组事实F(如关系数据库中的记录),模式是一个用语言L来表示的一个表达式E,它可用来描述数据集F的某个子集FE,E作为一个模式要求它比对数据子集FE的枚举要简单(所用的描述信息量要少)。过程在知识发现中通常指多阶段的一个过程,涉及数据准备、模式搜索、知识评价,以及反复地修改求精;该过程要求是非平凡的,意思是要有一定程度的智能性、自动性。有效性是指发现的模式对于新的数据仍保持有一定的可信度。新颖性要求发现的模式应该是新的。潜在有用性是指发现的知识将来有实际效用,如用于决策支持系统(decision support system,DSS)中可提高经济效益。可理解性要求发现的模式能被用户理解,目前它主要体现在简洁性上。有效性、新颖性、潜在有用性和可理解性综合在一起称为兴趣性。
知识发现与智能决策第1章绪论1.1.3知识发现的过程
知识发现是一门受到来自各种不同领域的研究