2.2逻辑模型设计
数据仓库的逻辑模型一般有星型模型和雪花模型两种。星型模型是基于关系型数据库的、面向OLAP的一种多维数据模型的数据组织形式,它由事实表和多个维度表组成,通过使用一个包括主题的事实表和多个包含事实的非正规化描述的维度表来第八:沟通渠道畅通 第九:与大客户发展战略保持一致 第十:与大客户结成战略合作伙伴或联盟
执行决策支持查询,从而获得比高度规范化设计结构更高的查询性能。 雪花模型虽然较星型模型更符合规范化的设计结构,但它增加了查询的复杂度,降低了查询的性能,因此,这里采用星型模型。星型模型的建立要以概念模型中的信息包圈为基础,将信息包图转换为星型模型,具体方法为:将信息包图中的度量实体放入星型模型的中心位置上,信息包图中的维度实体放入度量实体的周边。该客户信息数据仓库中客户购买主题的逻辑模型。
2.3物理模型设计
物理模型是指教据在数据仓库中的存放形式和组织形式。设计物理模型,要在星型模型或雪花模型的基础上,确定事实表和维表的结构;明确二者的数据字段、数据类型、关联字段、索引结构;确定数据仓库中多维数据集的存储结构,如物理存取方式、数据存储结构、数据存放位置以厦存储分配是否分区等。进行物理模型设计时,应重点考虑的因素有I/O存取时间、空间利用率和维护代价。
12.数据挖掘的1)主要任务、2)方法P19
4、3)步骤有哪些?P183主要任务,分类,估值,预言,相关性分组或关联规则,聚集,描述和可视化方法,决策树,集合论,遗传算法,神经网络。数据挖掘完整的步骤如下:① 理解数据和数据的来源(understanding)。② 获取相关知识与技术(acquisition)。③ 整合与检查数据(integration and checking)。④ 去除错误或不一致的数据(data cleaning)。⑤ 建立模型和假设(model and hypothesis development)。⑥ 实际数据挖掘工作(data mining)。⑦ 测试和验证挖掘结果(testing and verification)。⑧ 解释和应用(interpretation and use)。
1.定义商业问题2.建立数据挖掘模型3.分析数据4.准备数据5.建立模型6.评价模型7.实施,将数据挖掘运用到CRM方案中