Apache Hadoop
Doug Cutting, Mike Cafarella | |
Apache軟件 | |
2006 | |
| |
Java | |
Apache | |
hadoop |
Apache Hadoop
Apache Hadoop
Apache Hadoop
- Hadoop Common –
包含 了 其他Hadoop模 組 所 需的庫 和 實用 程 式 ; - Hadoop Distributed File System (HDFS) – 一種將數據儲存在叢集中多個節點中的分散式檔案系統,
能 夠提供 很高的 頻 寬 ; - Hadoop YARN – (於2012
年 引入) 一個負責管理叢集中計算資源,並 實現 用 戶 程 式 排 程 的 平台 [6][7]; - Hadoop MapReduce –
用 於大 規模 數 據 處理 的 MapReduce計算 模型 實現 ; - Hadoop Ozone – (於2020
年 引入) Hadoop的 對象 儲 存 。
Hadoop 一詞通常代指其基本模組和子模組以及生態系統[8],
Apache Hadoop
Hadoop
主要 子 專 案
[- Hadoop Common:
在 0.20及以前 的 版本 中 ,包含 HDFS、MapReduce和 其他專 案 公共 內容,從 0.21開始 HDFS和 MapReduce被 分離 為 獨立 的 子 專 案 ,其餘內容為 Hadoop Common - HDFS:Hadoop
分 佈式檔案系統 (Distributed File System)-HDFS(Hadoop Distributed File System) - MapReduce:
平行 計算 框 架 ,0.20前 使用 org.apache.hadoop.mapred舊 介 面 ,0.20版本 開始 引入org.apache.hadoop.mapreduce的 新 API
相關 專 案
[- Apache HBase:
分散 式 NoSQL列 資料 庫 ,類似 谷 歌 公司 BigTable。 - Apache Hive:構建於hadoop
之 上 的 數 據 倉庫 ,通過 一 種類 SQL語 言 HiveQL為 用 戶 提供 數 據 的 歸納 、查詢和 分析 等 功 能 。Hive最初 由 Facebook貢獻 。 - Apache Mahout:
機器 學習 演算 法 軟件套件。 - Apache Sqoop:
結構 化 數 據 (如關聯 式 資料 庫 )與 Apache Hadoop之 間 的 數 據 轉換 工具 。 - Apache ZooKeeper:
分散 式 鎖 設 施 ,提供 類似 Google Chubby的 功 能 ,由 Facebook貢獻 。 - Apache Avro:
新 的 數 據 序列 化 格式 與 傳 輸工具 ,將 逐步取 代 Hadoop原 有 的 IPC機 制 。
知名 用 戶
[Hadoop在 Yahoo!的 應用
[2008
其他用 戶
[其他
Hadoop與 Sun Grid Engine
[Hadoop與 Condor
[參 見
[大數 據 雲 端 運算 高 效能 計算 叢 集 - OpenStack-以Apache
特許 條 款特許 的 雲 端 運算 軟件。 - Apache Spark
參考 文獻
[- ^ Hadoop Releases. apache.org. Apache Software Foundation. [2019-04-28]. (
原始 內容存 檔於2019-04-28). - ^ Release 3.4.0 available. [2024
年 4月 10日 ]. - ^ Welcome to Apache Hadoop!. hadoop.apache.org. [2016-08-25]. (
原始 內容存 檔於2017-09-23). - ^ Malak, Michael. Data Locality: HPC vs. Hadoop vs. Spark. datascienceassn.org. Data Science Association. 2014-09-19 [2014-10-30]. (
原始 內容存 檔於2017-09-10). - ^ Wang, Yandong; Goldstone, Robin; Yu, Weikuan; Wang, Teng. Characterization and Optimization of Memory-Resident MapReduce on HPC Systems. 2014 IEEE 28th International Parallel and Distributed Processing Symposium. IEEE. October 2014: 799–808. ISBN 978-1-4799-3800-1. S2CID 11157612. doi:10.1109/IPDPS.2014.87.
- ^ Resource (Apache Hadoop Main 2.5.1 API). apache.org. Apache Software Foundation. 2014-09-12 [2014-09-30]. (
原始 內容存 檔於2014-10-06). - ^ Murthy, Arun. Apache Hadoop YARN – Concepts and Applications. hortonworks.com. Hortonworks. 2012-08-15 [2014-09-30]. (
原始 內容存 檔於2017-09-11). - ^ Continuuity Raises $10 Million Series A Round to Ignite Big Data Application Development Within the Hadoop Ecosystem. finance.yahoo.com. Marketwired. 2012-11-14 [2014-10-30]. (
原始 內容存 檔於2017-09-10). - ^ Hadoop-related projects at. Hadoop.apache.org. [2013-10-17]. (
原始 內容存 檔於2017-09-23). - ^ Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. John Wiley & Sons. 2014-12-19: 300 [2015-01-29]. ISBN 9781118876220.
- ^ nlpatumd; Adventures with Hadoop and Perl. Mail-archive.com. 2010-05-02 [2013-04-05]. (
原始 內容存 檔於2017-08-14). - ^ Yahoo! Launches World's Largest Hadoop Production Application (Hadoop and Distributed Computing at Yahoo!). [2008-09-04]. (
原始 內容存 檔於2008-05-14). - ^ PoweredBy. [2008-09-07]. (
原始 內容存 檔於2012-11-29). - ^ Creating Hadoop pe under SGE. Sun Microsystems. 2008-01-16 [2008-09-04]. (
原始 內容存 檔於2008-09-12). - ^ HDFS-Aware Scheduling With Grid Engine (PDF). Sun Microsystems. 2009-09-10.[
永久 失效 連結 ] - ^ Condor integrated with Hadoop's Map Reduce (PDF).
威 斯康辛 大學 麥 迪 遜 分校 . 2010-04-15 [2011-03-15]. (原始 內容存 檔 (PDF)於2011-04-01).
外部 連結
[