联机分析 ぶんせき 处理 (英語 えいご :Online analytical processing ),简称OLAP ( ),是 ぜ 计算机 つくえ 技 わざ 术 中 ちゅう 快速 かいそく 解 かい 决多 た 维分析 ぶんせき 问题 (MDA)的 てき 一 いち 种方法 ほう 。[ 1] OLAP是 ぜ 更 さら 广泛的 てき 商 しょう 业智能 ちのう 范畴的 てき 一 いち 部分 ぶぶん ,它还包括 ほうかつ 关系数 すう 据 すえ 库 、报告编写和 わ 数 かず 据 すえ 挖掘 。[ 2] OLAP的 てき 典型 てんけい 应用包括 ほうかつ 销售业务报告 、市 し 场营销 、管理 かんり 报告、业务流 りゅう 程 ほど 管理 かんり (BPM)[ 3] 、預 あずか 算 さん 和 わ 预测 、財務 ざいむ 報 ほう 表 ひょう 以及类似领域,新 しん 的 てき 应用正 ただし 在 ざい 出 で 现,如农业 。[ 4] 术语“OLAP”是 ぜ 对传统数据 すえ 库术语“联机事 ごと 务处理 り ”(OLTP)稍 やや 微 ほろ 修 おさむ 改 あらため 而成的 てき 。[ 5]
OLAP工具 こうぐ 让用户能够从多 た 个角度 かくど 交互 こうご 地 ち 分析 ぶんせき 多 た 维数据 すえ 。OLAP由 よし 三个基本的分析操作组成:上卷 じょうかん (roll-up)、钻取(drill-down)、切片 せっぺん (slicing)和 かず 切 きり 块(dicing)。[ 6] :402-403 上卷 じょうかん 涉 わたる 及可以在一个或多个维度中累积和计算的数据的聚合。例 れい 如,所有 しょゆう 的 てき 销售办事处汇总到销售部 ぶ 门,以预测销售趋势。相 そう 比 ひ 之 の 下 した ,钻取是 ぜ 一种允许用户浏览详细信息的技术。例 れい 如,用 よう 户可以查看 み 组成一个地区销售额的单个产品的销售额。切片 せっぺん 和 わ 切 きり 块是说,用 よう 户可以从OLAP多 た 维数据 すえ 集中 しゅうちゅう 取出 とりで (切片 せっぺん )一 いち 组特定 とくてい 的 てき 数 すう 据 すえ ,并从不同 ふどう 的 てき 角度 かくど 查看(切 きり 块)切片 せっぺん 。这些角度 かくど 有 ゆう 时被称 しょう 为维度 ど (例 れい 如按销售人 じん 员、按日期 き 、按客户、按产品 ひん 或 ある 按地区 ちく 查看相 しょう 同 どう 的 てき 销售情 じょう 况等)。
为OLAP配置 はいち 的 てき 数 かず 据 すえ 库使用 しよう 多 た 维数据 すえ 模型 もけい ,允 まこと 许快速 そく 执行复杂的 てき 分析 ぶんせき 查询和 わ 即席 そくせき 查询。[ 7] 它们借鉴了导航型 がた 数 すう 据 すえ 库 、层次型 がた 数 すう 据 すえ 库 和 かず 关系型 がた 数 すう 据 すえ 库的各 かく 个方面 めん 。
OLAP通常 つうじょう 与 あずか OLTP (联机事 ごと 务处理 り )形成 けいせい 对比,OLTP的 てき 特 とく 点 てん 是 ぜ 查询的 てき 复杂性 せい 要 よう 小 しょう 得 とく 多 た ,而且查询量 りょう 要 よう 大 だい 得 とく 多 た ,以处理事 りじ 务,而不是 ぜ 用 よう 于商业智能 ちのう 或 ある 报告。OLAP系 けい 统主要 よう 针对读取进行优化,而OLTP得能 とくのう 处理各 かく 种查询(读取、插入 そうにゅう 、更新 こうしん 和 わ 删除)。
OLAP系 けい 统的核心 かくしん 是 ぜ 一 いち 个OLAP多 た 维数据 すえ 集 しゅう 。它由称 しょう 为度量 どりょう 的 てき 数字 すうじ 事 ごと 实组成 なり ,这些数字 すうじ 事 ごと 实按维度进行分 ぶん 类。这些度量 どりょう 被 ひ 放置 ほうち 在 ざい 超 ちょう 立方体 りっぽうたい 的 てき 交点 こうてん 处。操作 そうさ 一 いち 个OLAP多 た 维数据 すえ 集 しゅう 的 てき 通常 つうじょう 接 せっ 口 こう 是 ぜ 一个矩阵接口,就像电子表 ひょう 格 かく 程 ほど 序 じょ 中 ちゅう 的 てき 数 すう 据 すえ 透 とおる 视表一 いち 样,它沿着 ぎ 维度执行投影 とうえい 操作 そうさ ,例 れい 如聚合 ごう 或 ある 求 もとめ 平均 へいきん 值。
多 た 维数据 すえ 集 しゅう 元 もと 数 すう 据 すえ 通常 つうじょう 是 ぜ 从关系数 すう 据 すえ 库 中 なか 的 てき 表 ひょう 的 てき 星 ほし 型 がた 模 も 式 しき 、雪 ゆき 花 はな 型 がた 模 も 式 しき 或 ある 事 こと 实星座 せいざ 中 ちゅう 创建的 てき 。度量 どりょう 来 き 自 じ 事 こと 实表中 なか 的 てき 记录,维度来 き 自 じ 维度表 ひょう 。
可 か 以认为每个度量 りょう 都 と 有 ゆう 一 いち 组标签 ,或 ある 者 もの 与 あずか 之 これ 关联的 てき 元 もと 数 すう 据 すえ 。维度 是 ぜ 描述这些标签 的 てき 东西; 它提供 ていきょう 有 ゆう 关度量 どりょう 的 てき 信 しん 息 いき 。
举一个简单地多维数据集的例子,商店 しょうてん 的 てき 销售额作为度量 どりょう ,日 にち 期 き /时间作 さく 为维度 。每 まい 个销售都有 ゆう 一 いち 个日期 き /时间标签 ,描述更 さら 多 た 关于该销售的信 しん 息 いき 。
如下所 しょ 示 しめせ :
Sales Fact Table
+-------------+----------+
| sale_amount | time_id |
+-------------+----------+ Time Dimension
| 2008.10| 1234 |----+ +---------+-------------------+
+-------------+----------+ | | time_id | timestamp |
| +---------+-------------------+
+---->| 1234 | 20080902 12:35:43 |
+---------+-------------------+
多 た 维结构被定 てい 义为“使用 しよう 多 た 维结构组织数据 すえ 并表达数据 すえ 之 の 间关系 けい 的 てき 关系模型 もけい 的 てき 变体”。[ 6] :177 该结构被分解 ぶんかい 成 なり 多 た 个超立方体 りっぽうたい ,并且在 ざい 每 まい 个超立方体 りっぽうたい 的 てき 范围内 ない 都 と 能 のう 存 そん 储和访问数 すう 据 すえ 。“多 た 维结构中的 てき 每 まい 个单元 もと 都 と 包含 ほうがん 与 あずか 其维度 ど 上 じょう 的 てき 元素 げんそ 相 しょう 关的聚合数 すう 据 すえ ”。[ 6] :178 即 そく 使 つかい 对数据 すえ 进行操作 そうさ ,也很容易 ようい 访问并继续构成 なり 一种紧凑的数据库格式。数 かず 据 すえ 仍然是 ぜ 相互 そうご 关联的 てき 。
对于使用 しよう OLAP应用程 ほど 序 じょ 的 てき 分析 ぶんせき 数 すう 据 すえ 库,多 た 维结构非常 ひじょう 流行 りゅうこう 。[ 6] 分析 ぶんせき 型 がた 数 すう 据 すえ 库使用 しよう 这些数 すう 据 すえ 库,是 ぜ 因 いん 为它们能够快速 そく 地 ち 为复杂的业务查询提供 ていきょう 答案 とうあん 。可 か 以从不同 ふどう 的 てき 角度 かくど 查看数 すう 据 すえ ,这与其他模型 もけい 不同 ふどう ,为问题提供 ていきょう 了 りょう 更 さら 广阔的 てき 视角。[ 8]
据 すえ 称 たたえ ,对于复杂查询,OLAP多 た 维数据 すえ 集 しゅう 可 か 以在大 だい 约0.1%的 てき 时间内 ない 生成 せいせい 对OLTP 关系数 すう 据 すえ 的 てき 相 しょう 同 どう 查询所 しょ 需的答案 とうあん 。[ 9] [ 10] OLAP中 ちゅう 允 まこと 许其实现此类性能 せいのう 的 てき 最 さい 重要 じゅうよう 机 つくえ 制 せい 是 ぜ 使用 しよう 聚合。聚合是 ぜ 通 どおり 过更改 こうかい 特定 とくてい 维度的 てき 粒 つぶ 度 ど 并使用 しよう 聚合函数 かんすう 沿着这些维度聚合数 すう 据 すえ ,从事实表构建的 てき 。可能 かのう 聚合的 てき 数量 すうりょう 由 よし 每 ごと 个可能 かのう 的 てき 维度粒 つぶ 度 ど 组合决定。
所有 しょゆう 可能 かのう 的 てき 聚合和 かず 基 はじめ 础数据 すえ 的 てき 组合包含 ほうがん 可 か 以从数 すう 据 すえ 应答的 てき 每 まい 个查询的答案 とうあん 。[ 11]
因 いん 为通常 つうじょう 有 ゆう 许多可 か 以计算 さん 的 てき 聚合,所以 ゆえん 通常 つうじょう 只 ただ 有 ゆう 预先确定的 てき 数字 すうじ 被 ひ 完全 かんぜん 计算; 其余的 てき 则根据 すえ 需要 じゅよう 求 もとめ 解 かい 。决定要 よう 计算哪些聚合(视图)的 てき 问题称 しょう 为视图选择问题。视图选择可 か 以受到所 しょ 选聚合 ごう 集 しゅう 的 てき 总大小 しょう 、根 ね 据 すえ 基 もと 础数据 すえ 的 てき 更改 こうかい 更新 こうしん 它们的 てき 时间的 てき 限 きり 制 せい ,或 ある 者 もの 同 どう 时受两者的 てき 限 きり 制 せい 。视图选择的 てき 目 め 标通常 つうじょう 是 ぜ 最小 さいしょう 化 か 进行OLAP查询的 てき 平均 へいきん 时间,尽 つき 管 かん 一些研究也最小化了更新时间。视图选择是 ぜ NP完全 かんぜん 问题。这个问题已 やめ 经被探索 たんさく 了 りょう 许多方法 ほうほう ,包括 ほうかつ 贪心算法 さんぽう 、随 ずい 机 つくえ 搜索 そうさく 、遗传算法 さんぽう 和 わ A*搜 さがせ 尋 ひろ 演算 えんざん 法 ほう 。
对于整 せい 个OLAP多 た 维数据 すえ 集 しゅう ,可 か 以通过预先 さき 计算每 ごと 个单元 もと 的 てき 值来计算一 いち 些聚合 あい 函数 かんすう ,然 しか 后 きさき 通 どおり 过聚合 あい 这些聚合来 らい 计算单元汇总的 てき 聚合,并对多 た 维问题应用 よう 分 ぶん 治 ち 法 ほう 来 らい 有效 ゆうこう 地 ち 计算这些聚合。 例 れい 如,所有 しょゆう 的 てき 总和就是每 ごと 个单元 もと 的 てき 子 こ 和 わ 的 てき 总和。可 か 以这样分解 ぶんかい 的 てき 函数 かんすう 称 しょう 为可分解 ぶんかい 聚合函数 かんすう ,包括 ほうかつ COUNT、MAX、MIN
和 わ SUM
,这些函数 かんすう 可 か 以为每 ごと 个单元 もと 计算,然 しか 后 きさき 直接 ちょくせつ 聚合;这些函数 かんすう 称 しょう 为自可 か 分解 ぶんかい 聚合函数 かんすう 。 在 ざい 其他情 じょう 况下,聚合函数 かんすう 可 か 以通过计算 さん 单元的 てき 辅助数 すう ,聚合这些辅助数 すう ,最 さい 后 きさき 计算最 さい 后 きさき 的 てき 总数来 らい 计算;例 れい 子 こ 有 ゆう AVERAGE
(跟踪和 わ 与 あずか 数量 すうりょう ,最 さい 后 きさき 再 さい 做除法 ほう )和 わ RANGE
(跟踪最大 さいだい 值和最小 さいしょう 值,最 さい 后 きさき 再 さい 相 あい 减)。在 ざい 其他情 じょう 况下,如果不 ふ 立 だて 即 そく 分析 ぶんせき 整 せい 个集合 しゅうごう ,就无法 ほう 计算聚合函数 かんすう ,尽 つき 管 かん 在 ざい 某 ぼう 些情况下可 か 以计算 さん 近似 きんじ 值;例 れい 如DISTINCT COUNT、MEDIAN
和 わ MODE
;例 れい 如,集合 しゅうごう 的 てき 中位 ちゅうい 数 すう 不等 ふとう 于子集 しゅう 的 てき 中位 ちゅうい 数 すう 。后 きさき 者 しゃ 很难在 ざい OLAP中 ちゅう 有效 ゆうこう 地 ち 实现,因 いん 为它们需要 じゅよう 在 ざい 基 もと 础数据 すえ 上 じょう 计算聚合函数 かんすう ,或 ある 者 もの 在 ざい 线(慢)计算它们,或 ある 者 もの 为可能 かのう 的 てき 展 てん 开(大空 おおぞら 间)进行预计算 さん 。
^ Codd E.F.; Codd S.B. & Salley C.T. Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate (PDF) . Codd & Date, Inc. 1993 [2008-03-05 ] . [永久 えいきゅう 失效 しっこう 連結 れんけつ ]
^ Deepak Pareek. Business Intelligence for Telecommunications . CRC Press. 2007: 294 pp [2008-03-18 ] . ISBN 978-0-8493-8792-0 . (原始 げんし 内容 ないよう 存 そん 档于2021-04-30).
^ Apostolos Benisis. Business Process Management:A Data Cube To Analyze Business Process Simulation Data For Decision Making . VDM Verlag Dr. Müller e.K. 2010: 204 pp. ISBN 978-3-639-22216-6 .
^
Abdullah, Ahsan. Analysis of mealybug incidence on the cotton crop using ADSS-OLAP (Online Analytical Processing) tool. Computers and Electronics in Agriculture. November 2009, 69 (1): 59–72. doi:10.1016/j.compag.2009.07.003 .
^ OLAP Council White Paper (PDF) . OLAP Council. 1997 [2008-03-18 ] . (原始 げんし 内容 ないよう 存 そん 档 (PDF) 于2016-06-23).
^ 6.0 6.1 6.2 6.3 O'Brien, J. A., & Marakas, G. M. (2009). Management information systems (9th ed.). Boston, MA: McGraw-Hill/Irwin.
^ Hari Mailvaganam. Introduction to OLAP – Slice, Dice and Drill! . Data Warehousing Review. 2007 [2008-03-18 ] . (原始 げんし 内容 ないよう 存 そん 档 于2018-09-28).
^ Williams, C., Garza, V.R., Tucker, S, Marcus, A.M. (1994, January 24). Multidimensional models boost viewing options. InfoWorld, 16(4)
^ MicroStrategy, Incorporated. The Case for Relational OLAP (PDF) . 1995 [2008-03-20 ] . (原始 げんし 内容 ないよう 存 そん 档 (PDF) 于2013-06-27).
^ Surajit Chaudhuri & Umeshwar Dayal. An overview of data warehousing and OLAP technology. SIGMOD Rec. 1997, 26 (1): 65. CiteSeerX 10.1.1.211.7178 . doi:10.1145/248603.248616 .
^ Gray, Jim ; Chaudhuri, Surajit; Layman, Andrew; Reichart, Don; Venkatrao, Murali; Pellow, Frank; Pirahesh, Hamid. Data Cube: {A} Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals . J. Data Mining and Knowledge Discovery. 1997, 1 (1): 29–53 [2008-03-20 ] . arXiv:cs/0701155 . doi:10.1023/A:1009726021843 .
创建数 すう 据 すえ 仓库
Concepts Variants Elements Fact Dimension Filling