亚博
下载此文档 放大查看 缩小查看   1 / 7
0/100
您的亚博器不支持进度条
更多>> 该用户其他文档
下载所得到的文件列表
知识工程复习题.doc
文档介绍:
知识是数据和信息集合的整体。只有当信息被系统地、有目的地积累起来时,才能转变成知识。知识是由信息描述的,信息则是用数据来表达的;知识工程是设计和实现知识库系统及知识库应用系统的理论、方法和技术,是研究知识获取、知识表示、知识管理和知识运用的一门学科。数据工程处理的对象是数据,即反映信息的数据。知识工程处理的对象是知识。即信息之间关联的关联。软件工程处理的对象是模块,即软件模块或构件。知识工程是一个远比数据工程复杂的多的领域,也是一个比数据工程更富于挑战性的领域,表现在:1、知识种类比较多2、知识的表示方式比较多3、要有一个较好的知识表示方式和知识管理机制。知识工程与数据工程关系:数据工程是为了创建一种数据库系统以及数据库应用系统,知识工程则是为了创建一种知识库系统以及知识库应用系统。它们都是一种应用软件或软件系统,其开发过程也遵从软件工程的一般原则。但也有其本质上的差别:知识工程应用系统的形成也需要经过三个阶段:1、需求分析阶段(what-to-do):数据工程:把E-R图作为分析阶段的结果。知识工程:还要分析问题之间的关联关系,从而定义问题的求解规则。2、设计阶段(how-to-do):数据工程:要解决的问题是从概念结构的关联中寻找极小化的逻辑结构。知识工程:要解决的问题是从概念结构的关于关联的关联中寻找极小化的逻辑结构。3、实现阶段(do-to-do):数据工程:按照要求对数据库中的数据进行适当的调整。知识工程:除了针对具体问题做一些适当的调整外,几乎不做什么事情。在知识工程中,最为困难的问题是知识获取,一般来说,知识获取的方法有两种情况:1、由知识工程师从领域专家那里获取知识,即:人工获取。2、从数据库数据中发现知识(KDD),即数据挖掘。决策支持系统(DSS—decisionsupportsystem)数据挖掘(DW—DataWarehouse)数据仓库是一个“面向主题的”、“完整的”、“非易失的”、“不同时间的”、“用于支持决策管理”的数据集合,用以支持经营管理中的决策制定过程。数据仓库是为决策支持服务的;数据库系统是为事务处理服务的。非易失性指的是数据仓库是只读的,数据一旦经集成进入数据仓库后,数据一般不能被回写,也就是说数据是稳定的,具有稳定性数据仓库中的数据时限为:5-10年数据仓库和数据库存在着根本不同:1、数据存储方式的不同2、数据存储量的不同3、存储的结构不同数据仓库的数据量是数据库数据量的100倍,数据量大的原因在于:(1)数据库中的数据是按决策主题重新组织并集成起来的数据;(2)保留了大量的历史数据,用于预测分析;(3)对当前数据进行了轻度或高度综合后形成了综合数据。数据仓库中的数据=当前数据+历史数据+综合数据粒度反映了数据仓库中数据单位中保存数据的细化或综合程度的级别,是数据仓库中数据的最基本元素或单位。确定数据粒度是设计数据仓库的重要环节,它决定了“怎样去载入数据”,也反映了数据仓库设计师对用户的要求和系统传递的信息单位。在许多实际应用中,数据的粒度级别是不同的。一般来说,细化程度越高,粒度级别就越小;反之,细化的程度越低,粒度级别就越大。高粒度数据不仅只需要很少的字节去存储数据,而且索引项也比较小,这对于节省存储空间提高数据分析效率是有益的。如果数据仓库的空间是有限的话,用高粒度表示数据比用低粒度表示数据的效率高得多 内容来自亚博www.totaldanceuk.com转载请标明出处.