商务智能复习-OLAP

发表于 2026-06-21 更新于 2026-06-29 分类于商务智能本文字数： 2k 阅读时长 ≈ 7 分钟

OLAP

Codd 关于OLAP的评价准则

这些只需要理解就可以，不要背诵 ~~（不过我不知道咋考就对了）~~

多维概念视图
- OLAP必须提供多维概念视图，从多个维度考察对象
透明性准则
- OLAP在体系结构中的位置对用户是透明的
- OLAP的数据源对用户也是透明的
存取能力准则
- 将OLAP的概念视图映射到异质的数据存储上
- 能访问数据并执行所需转换，从而提供单一、完整、连续的用户视图
稳定的报表功能
- 数据的维数和数据的综合层次增加时，提供给最终分析人员的报表能力和响应速度不应该有明显的降低和减慢
客户/服务器体系结构
- 服务器保证透明性和建立统一的公共概念模式、逻辑模式和物理模式
- 客户端负责应用逻辑和界面
维的同等性原则
- 每一数据维在数据结构和操作能力上都是等同的
动态的稀疏矩阵处理准则
- OLAP工具必须使得模型的物理模式充分适应指定的维数，尤其是特定模型的数据分布
多用户支持能力准则
- OLAP工具必须提供并发访问、数据完整性及安全性机制
非受限的跨维操作
- 对于多维数据之间存在的固有的层次关系，OLAP工具应自己推导而不是由用户明确定义相关计算
- 对于无法从固有关系中得出的计算，提供计算完备的语言来定义各种计算公式
直观的数据操作
- 提供直观易用的数据操作方式，降低用户使用门槛
灵活的报表生成
- 支持灵活多样的报表生成方式，满足不同分析需求
不受限维与聚集层次
- 维数不应小于15
- 支持任意聚集层次

MOLAP和ROLAP的差别

OLAP 的基本数据模型

MOLAP

多维联机分析处理（MOLAP）

MOLAP使用专门的多维数据库来存放所需要的数据
数据以多维的方式存放，并且使用多维的方式进行展现。
多维数组比关系数据表表达更清晰且占用存储小（在处理稠密数据时）
高速的综合速度，MOLAP适用于需要高速处理的复杂分析
维护多维数组需要大量资源

多维数据库存取

经压缩的、类似于数组的对象构成
这些对象带有高度压缩的索引及指针结构
并非维间的每种维成员组合都对应合理的度量值，MDDB必须具有高效的稀疏数据处理能力，能略过零元、缺失和重复数据
使用多维查询语言MDSQL

ROLAP

关系联机分析处理（ROLAP）

ROLAP使用通用的关系数据库来存储所需数据
ROLAP适应于处理大量数据
低效率
现有的关系型数据库已经对OLAP做了很多优化，包括并行存储、并行查询、并行数据管理、基于成本的查询优化、位图索引、SQL的OLAP扩展(cube, rollup)等，性能有所提高

常用的两种ROLAP数据模型

重点是区分这两种模式

星形模型
雪花模型

星型模式

星型模式

星型模式是一种多维表结构，它一般由两种不同性质的二维表组成：
- 事实表（Fact table）：存放多维表中的主要事实，称为度量值（Measure）
- 维表（Dimension Table）：存放多维表中的维成员的取值
一般一个n维的多维表往往有n个维表和一个事实表，它们构成了一个星形结构，因而称其为“星型模式”
在星型模式中主体是事实表，而有关维的细节则放置于维表内以达到简化事实表的目的，事实表与维表间由公共属性相连以使它们构成一个整体