(Translated by https://www.hiragana.jp/)
線上分析處理 - 维基百科,自由的百科全书 とべ转到内容ないよう

線上せんじょう分析ぶんせき處理しょり

本页使用了标题或全文手工转换
维基百科ひゃっか自由じゆうてき百科ひゃっかぜん
重定しげさだこうOLAP

联机分析ぶんせき处理英語えいごOnline analytical processing),简称OLAP (/ˈlæp/),计算つくえわざちゅう快速かいそくかい分析ぶんせき问题えいmulti-dimensional analytical(MDA)てきいち种方ほう[1] OLAPさら广泛てきしょう智能ちのう范畴てきいち部分ぶぶん,它还包括ほうかつ关系すうすえ、报告编写かずすえ挖掘[2] OLAPてき典型てんけい应用包括ほうかつ销售业务报告えいbusiness reporting场营销管理かんり报告、业务りゅうほど管理かんり(BPM)[3]あずかさん预测財務ざいむほうひょう以及类似领域,しんてき应用ただしざい现,如农业[4] 术语“OLAP”对传统数すえ库术语“联机ごと务处”(OLTP)ややほろおさむあらため而成てき[5]

OLAP工具こうぐ让用户能够从角度かくど交互こうご分析ぶんせき维数すえ。OLAPよし三个基本的分析操作组成:上卷じょうかん(roll-up)、钻取(drill-down)、切片せっぺん(slicing)かずきり块(dicing)。[6]:402-403 上卷じょうかんわたる及可以在一个或多个维度中累积和计算的数据的聚合。れい如,所有しょゆうてき销售办事处汇总到销售门,以预测销售趋势。そうした,钻取一种允许用户浏览详细信息的技术。れい如,よう户可以查组成一个地区销售额的单个产品的销售额。切片せっぺんきり块是说,よう户可以从OLAP维数すえ集中しゅうちゅう取出とりで切片せっぺんいち特定とくていてきすうすえ,并从不同ふどうてき角度かくど查看(きり块)切片せっぺん。这些角度かくどゆう时被しょう为维れい如按销售じん员、按日、按客户、按产ひんある地区ちく查看しょうどうてき销售じょう况等)。

为OLAP配置はいちてきかずすえ使用しよう维数すえ模型もけいまこと许快そく执行复杂てき分析ぶんせき查询即席そくせき查询。[7] 它们借鉴了导航がたすうすええいnavigational database层次がたすうすえかず关系がたすうすえ库的かく个方めん

OLAP通常つうじょうあずかOLTP(联机ごと务处形成けいせい对比,OLTPてきとくてん查询てき复杂せいようしょうとく,而且查询りょうようだいとく,以处理事りじ务,而不よう于商业智能ちのうある报告。OLAPけい统主よう针对读取进行优化,而OLTP得能とくのう处理かく种查询(读取、插入そうにゅう更新こうしん删除)。

OLAPけい统概じゅつ

[编辑]

OLAPけい统的核心かくしんいちOLAP维数すえしゅうえいOLAP cube。它由しょう度量どりょうてき数字すうじごと实组なり,这些数字すうじごと实按维度进行ぶん类。这些度量どりょう放置ほうちざいちょう立方体りっぽうたいてき交点こうてん处。操作そうさいち个OLAP维数すえしゅうてき通常つうじょうせっこう一个矩阵接口,就像电子ひょうかくほどじょちゅうてきすうすえとおる视表いち样,它沿维度执行投影とうえい操作そうされい如聚ごうあるもとめ平均へいきん值。

维数すえしゅうもとすうすえ通常つうじょう关系すうすえなかてきひょうてきほしがたしきゆきはながたしきえいsnowflake schemaあること星座せいざえいfact constellationちゅう创建てき度量どりょうこと实表えいfact tableなかてき记录,维度维度ひょうえいdimension table

以认为每个度りょうゆういち标签あるものあずかこれ关联てきもとすうすえ维度描述这些标签てき东西; 它提供ていきょうゆう度量どりょうてきしんいき

举一个简单地多维数据集的例子,商店しょうてんてき销售额作为度量どりょうにち/时间さく维度まい个销售都ゆういち个日/时间标签,描述さら关于该销售的しんいき

如下しょしめせ

 Sales Fact Table
+-------------+----------+
| sale_amount | time_id  |
+-------------+----------+            Time Dimension
|      2008.10|     1234 |----+     +---------+-------------------+
+-------------+----------+    |     | time_id | timestamp         |
                              |     +---------+-------------------+
                              +---->|   1234  | 20080902 12:35:43 |
                                    +---------+-------------------+

维数すえ

[编辑]

维结构被てい义为“使用しよう维结构组织数すえ并表达数すえ间关けいてき关系模型もけいてき变体”。[6]:177 该结构被分解ぶんかいなり个超立方体りっぽうたい,并且ざいまい个超立方体りっぽうたいてき范围ないのうそん储和访问すうすえ。“维结构中てきまい个单もと包含ほうがんあずか其维じょうてき元素げんそしょう关的聚合すうすえ”。[6]:178 そく使つかい对数すえ进行操作そうさ,也很容易ようい访问并继续构なり一种紧凑的数据库格式。かずすえ仍然相互そうご关联てき。 对于使用しようOLAP应用ほどじょてき分析ぶんせきすうすえ库,维结构非常ひじょう流行りゅうこう[6] 分析ぶんせきがたすうすえ使用しよう这些すうすえ库,いん为它们能够快そく为复杂的业务查询提供ていきょう答案とうあん以从不同ふどうてき角度かくど查看すうすえ,这与其他模型もけい不同ふどう,为问题提供ていきょうりょうさら广阔てき视角。[8]

聚合

[编辑]

すえたたえ,对于复杂查询,OLAP维数すえしゅう以在だい约0.1%てき时间ない生成せいせいOLTP关系すうすえてきしょうどう查询しょ需的答案とうあん[9][10] OLAPちゅうまこと许其实现此类性能せいのうてきさい重要じゅうようつくえせい使用しよう聚合。聚合どおり更改こうかい特定とくてい维度てきつぶ使用しよう聚合函数かんすう沿着这些维度聚合すうすえ,从事实表构建てき可能かのう聚合てき数量すうりょうよしごと可能かのうてき维度つぶ组合决定。

所有しょゆう可能かのうてき聚合かずはじめ础数すえてき组合包含ほうがん以从すうすえ应答てきまい个查询的答案とうあん[11]

いん通常つうじょうゆう许多以计さんてき聚合,所以ゆえん通常つうじょうただゆう预先确定てき数字すうじ完全かんぜん计算; 其余てき则根すえ需要じゅようもとめかい。决定よう计算哪些聚合(视图)てき问题しょう为视图选择问题。视图选择以受到しょ选聚ごうしゅうてき总大しょうすえもと础数すえてき更改こうかい更新こうしん它们てき时间てききりせいあるものどう时受两者てききりせい。视图选择てき通常つうじょう最小さいしょう进行OLAP查询てき平均へいきん时间,つきかん一些研究也最小化了更新时间。视图选择NP完全かんぜん问题。这个问题やめ经被探索たんさくりょう许多方法ほうほう包括ほうかつ贪心算法さんぽうずいつくえ搜索そうさく遗传算法さんぽうA*さがせひろ演算えんざんほう

对于せい个OLAP维数すえしゅう以通过预さき计算ごと个单もとてき值来计算いち些聚あい函数かんすうしかきさきどおり过聚あい这些聚合らい计算单元汇总てき聚合,并对维问题应ようぶんほうらい有效ゆうこう计算这些聚合。[12] れい如,所有しょゆうてき总和就是ごと个单もとてきてき总和。以这样分解ぶんかいてき函数かんすうしょう为可分解ぶんかい聚合函数かんすう包括ほうかつCOUNT、MAX、MINSUM,这些函数かんすう以为ごと个单もと计算,しかきさき直接ちょくせつ聚合;这些函数かんすうしょう为自分解ぶんかい聚合函数かんすう[13] ざい其他じょう况下,聚合函数かんすう以通过计さん单元てき辅助すう,聚合这些辅助すうさいきさき计算さいきさきてき总数らい计算;れいゆうAVERAGE(跟踪あずか数量すうりょうさいきさきさい做除ほうRANGE(跟踪最大さいだい值和最小さいしょう值,さいきさきさいあい减)。ざい其他じょう况下,如果だてそく分析ぶんせきせい集合しゅうごう,就无ほう计算聚合函数かんすうつきかんざいぼう些情况下以计さん近似きんじ值;れいDISTINCT COUNT、MEDIANMODEれい如,集合しゅうごうてき中位ちゅういすう不等ふとう于子しゅうてき中位ちゅういすうきさきしゃ很难ざいOLAPちゅう有效ゆうこう实现,いん为它们需要じゅようざいもと础数すえじょう计算聚合函数かんすうあるものざい线(慢)计算它们,あるもの可能かのうてきてん开(大空おおぞら间)进行预计さん

参考さんこう文献ぶんけん

[编辑]
  1. ^ Codd E.F.; Codd S.B. & Salley C.T. Providing OLAP (On-line Analytical Processing) to User-Analysts: An IT Mandate (PDF). Codd & Date, Inc. 1993 [2008-03-05]. [永久えいきゅう失效しっこう連結れんけつ]
  2. ^ Deepak Pareek. Business Intelligence for Telecommunications. CRC Press. 2007: 294 pp [2008-03-18]. ISBN 978-0-8493-8792-0. (原始げんし内容ないようそん档于2021-04-30). 
  3. ^ Apostolos Benisis. Business Process Management:A Data Cube To Analyze Business Process Simulation Data For Decision Making. VDM Verlag Dr. Müller e.K. 2010: 204 pp. ISBN 978-3-639-22216-6. 
  4. ^ Abdullah, Ahsan. Analysis of mealybug incidence on the cotton crop using ADSS-OLAP (Online Analytical Processing) tool. Computers and Electronics in Agriculture. November 2009, 69 (1): 59–72. doi:10.1016/j.compag.2009.07.003. 
  5. ^ OLAP Council White Paper (PDF). OLAP Council. 1997 [2008-03-18]. (原始げんし内容ないようそん (PDF)于2016-06-23). 
  6. ^ 6.0 6.1 6.2 6.3 O'Brien, J. A., & Marakas, G. M. (2009). Management information systems (9th ed.). Boston, MA: McGraw-Hill/Irwin.
  7. ^ Hari Mailvaganam. Introduction to OLAP – Slice, Dice and Drill!. Data Warehousing Review. 2007 [2008-03-18]. (原始げんし内容ないようそん于2018-09-28). 
  8. ^ Williams, C., Garza, V.R., Tucker, S, Marcus, A.M. (1994, January 24). Multidimensional models boost viewing options. InfoWorld, 16(4)
  9. ^ MicroStrategy, Incorporated. The Case for Relational OLAP (PDF). 1995 [2008-03-20]. (原始げんし内容ないようそん (PDF)于2013-06-27). 
  10. ^ Surajit Chaudhuri & Umeshwar Dayal. An overview of data warehousing and OLAP technology. SIGMOD Rec. 1997, 26 (1): 65. CiteSeerX 10.1.1.211.7178可免费查阅. doi:10.1145/248603.248616. 
  11. ^ Gray, Jim; Chaudhuri, Surajit; Layman, Andrew; Reichart, Don; Venkatrao, Murali; Pellow, Frank; Pirahesh, Hamid. Data Cube: {A} Relational Aggregation Operator Generalizing Group-By, Cross-Tab, and Sub-Totals. J. Data Mining and Knowledge Discovery. 1997, 1 (1): 29–53 [2008-03-20]. arXiv:cs/0701155可免费查阅. doi:10.1023/A:1009726021843. 
  12. ^ Zhang 2017だい1ぺーじ.
  13. ^ Jesus, Baquero & Almeida 2011,2.1 Decomposable functions, pp. 3–4.

まいり

[编辑]