(Translated by https://www.hiragana.jp/)
Apache Hive - Wikipedia コンテンツにスキップ

Apache Hive

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』
Hive
最新さいしんばん
2.3.4 / 2018ねん11月7にち (5ねんまえ) (2018-11-07)
リポジトリ ウィキデータを編集
プログラミング
言語げんご
Java
対応たいおうOS クロスプラットフォーム
サポートじょうきょう 開発かいはつちゅう
ライセンス Apache License 2.0
公式こうしきサイト hive.apache.org
テンプレートを表示ひょうじ

Apache HiveHadoopうえ構築こうちくされたデータウェアハウス 構築こうちく環境かんきょうであり、データの集約しゅうやくわせ・分析ぶんせきおこな[1]。Apache Hiveは当初とうしょFacebookによって開発かいはつされたが、そのNetflixのようにさまざまな団体だんたい開発かいはつ参加さんかし、またユーザーとなった[2][3]。 Hive はAmazon Web ServicesAmazon Elastic MapReduceにもふくまれている[4]

特徴とくちょう機能きのう

[編集へんしゅう]

Apache HiveはHadoop互換ごかんのファイルシステム(たとえばAmazon S3)に格納かくのうされただい規模きぼデータセットの分析ぶんせきおこなう。使用しようには、map/reduce完全かんぜんにサポートしたSQLライクな「HiveQL」という言語げんごもちいる。クエリの高速こうそくのため、ビットマップインデックスふくめたインデクス機能きのう実装じっそうしている[5]

標準ひょうじゅん設定せっていでは、HiveはメタデータをApache Derbyデータベースに格納かくのうするが、オプションとしてはべつ用意よういしたクライアント・サーバデータベース(たとえばMySQL)に格納かくのうさせることもできる[6]

現在げんざい、Hiveがサポートするファイルフォーマットは3種類しゅるいあり、それらはTEXTFILE, SEQUENCEFILE および RCFILEである[7][8]

Hiveが提供ていきょうする機能きのうにはにはつぎのようなものがある[9]:

  • 高速こうそくのためのインデックス作成さくせい
  • べつ種類しゅるいのストレージタイプ。たとえばプレーンテキスト・RCFile・HBaseなど
  • クエリ実行じっこうのセマンティックチェック時間じかん大幅おおはば短縮たんしゅくするため、メタデータを関係かんけいデータベース管理かんりシステム (RDBMS) に格納かくのうする機能きのう
  • Hadoop環境かんきょう格納かくのうされた圧縮あっしゅくデータをあつか機能きのう
  • 日付ひづけがた文字もじれつがたあつかったりのデータ操作そうさ可能かのうとするみユーザ定義ていぎ関数かんすう(UDF)。関数かんすう用意よういされていない機能きのうもユーザが自作じさくUDFを作成さくせいすることで対応たいおうすることが可能かのう
  • SQLライクなクエリ言語げんご(Hive QL)。これは内部ないぶてきにMap/Reduceジョブに変換へんかんされる

HiveQLはSQLにもとづいているものの、厳密げんみつにはSQL-92をフルサポートしてはいない。たとえばSQLにない複数ふくすうテーブルインサートcreate table as select可能かのうだが、インデクスにかんしては限定げんていてきなサポートにとどまっている[10]。また、HiveQLはトランザクションやマテリアライズドビュー機能きのうはもたず、ふくわせのサポートも限定げんていてきである。[11][12]

内部ないぶてきには、コンパイラがHiveQLぶんをMap/Reduceジョブの有向ゆうこう巡回じゅんかいグラフ変換へんかんし、それがHadoopにわたされ実行じっこうされる[13]

関連かんれん項目こうもく

[編集へんしゅう]

参照さんしょう

[編集へんしゅう]
  1. ^ Venner, Jason (2009). Pro Hadoop. Apress. ISBN 978-1-4302-1942-2 
  2. ^ Use Case Study of Hive/Hadoop
  3. ^ OSCON Data 2011, Adrian Cockcroft, "Data Flow at Netflix" - YouTube
  4. ^ Amazon Elastic MapReduce Developer Guide
  5. ^ Working with Students to Improve Indexing in Apache Hive
  6. ^ Lam, Chuck (2010). Hadoop in Action. Manning Publications. ISBN 1-935182-19-6 
  7. ^ Facebook's Petabyte Scale Data Warehouse using Hive and Hadoop
  8. ^ Yongqiang He, Rubao Lee, Yin Huai, Zheng Shao, Namit Jain, Xiaodong Zhang and Zhiwei Xu. “RCFile: A Fast and Space-efficient Data Placement Structure in MapReduce-based Warehouse Systems” (PDF). 4,Nov. 2012閲覧えつらん
  9. ^ Hive – The next generation data warehouse
  10. ^ また、外部がいぶ結合けつごうはLEFTしかできない・JOINのONぶしでの不等式ふとうしきやBetweenの使用しよう制限せいげんがある・timestampがたはUNIX TIMEなので1970ねん以前いぜんや2037ねん以後いご日付ひづけ使つかえない・CSVから文字もじれつフィールドをLOAD DATAする場合ばあい、ENCLOSED指定してい出来できないのでじゅう引用いんようとう事前じぜん削除さくじょする必要ひつようがある・その場合ばあいでも明示めいじてきにNULLを指定していしたい場合ばあいには「\N」という特殊とくしゅ文字もじれつれておく必要ひつようがある、などがあり使用しようには注意ちゅういようする(日本語にほんご訳者やくしゃによる追記ついき。いずれもバージョン0.9.0の場合ばあい
  11. ^ White, Tom (2010). Hadoop: The Definitive Guide. O'Reilly Media. ISBN 978-1-4493-8973-4 
  12. ^ Hive Language Manual
  13. ^ Hive A Warehousing Solution Over a MapReduce Framework

外部がいぶリンク

[編集へんしゅう]