Apache Hadoop

Apache Hadoop
原作げんさく者しゃ	Doug Cutting, Mike Cafarella
開發かいはつ者しゃ	Apache軟件基金ききん會かい
首くび次じ釋しゃく出いずる	2006年ねん4月がつ1日にち，18年ねん前まえ
目前もくぜん版本はんぽん	3.4.0（2024年ねん3月がつ17日にち）;
原始げんし碼庫	git-wip-us.apache.org/repos/asf/hadoop.git;
程ほど式しき語ご言げん	Java
作業さぎょう系統けいとう	跨またが平台ひらだい
類型るいけい	大數たいすう據よりどころ、分ぶん佈式系統けいとう
特許とっきょ條じょう款	Apache特許とっきょ條じょう款 2.0
網あみ站	hadoop.apache.org

Apache Hadoop是ぜ一款支援數據密集型分ぶん佈式應用おうよう程ほど式しき並なみ以Apache 2.0許可きょか協定きょうてい發はつ佈的開源かいげん軟件框かまち架か，有ゆう助じょ於使用しよう許多きょた電腦でんのう組成そせい的てき網もう絡からま來らい解決かいけつ數すう據よりどころ、計算けいさん密集みっしゅう型がた的てき問題もんだい。基もと於MapReduce計算けいさん模型もけい，它為大數たいすう據よりどころ的てき分散ぶんさん式しき儲もうか存そん與あずか處理しょり提供ていきょう了りょう一いち個こ軟件框かまち架か。所有しょゆう的てきHadoop模も組ぐみ都と有ゆう一いち個こ基本きほん假設かせつ，即そく硬かた件けん故障こしょう是ぜ常見つねみ情況じょうきょう，應おう該由框かまち架か自動じどう處理しょり^[3]。

Apache Hadoop的てき核心かくしん模も組ぐみ分ぶん為ため儲もうか存そん和わ計算けいさん模も組ぐみ，前者ぜんしゃ被ひ稱しょう為ためHadoop分散ぶんさん式しき檔案系統けいとう（HDFS），後者こうしゃ即そくMapReduce計算けいさん模型もけい。Hadoop框かまち架か先さき將はた檔案分ぶん成なり數すう據よりどころ塊かたまり並なみ分散ぶんさん式しき地ち儲もうか存在そんざい叢くさむら集しゅう的てき計算けいさん節點せってん中ちゅう，接着せっちゃく將はた負ふ責せめ計算けいさん任務にんむ的てき代だい碼傳送でんそう給きゅう各かく節點せってん，讓ゆずる其能夠並列へいれつ地ち處理しょり數すう據よりどころ。這種方法ほうほう有效ゆうこう利用りよう了りょう數かず據よりどころ局部きょくぶ性せい，令れい各かく節點せってん分別ふんべつ處理しょり其能夠訪問ほうもん的てき數すう據よりどころ。與あずか傳統でんとう的てき超ちょう級きゅう電腦でんのう架か構相比ひ，這使得とく數すう據よりどころ集しゅう的てき處理しょり速度そくど更さら快かい、效率こうりつ更さら高だか^[4]^[5]。

Apache Hadoop框かまち架か由よし以下いか基本きほん模も組ぐみ構成こうせい：

Hadoop Common – 包含ほうがん了りょう其他Hadoop 模も組ぐみ所しょ需的庫こ和わ實用じつよう程ほど式しき；
Hadoop Distributed File System (HDFS) – 一種將數據儲存在叢集中多個節點中的分散式檔案系統，能のう夠提供ていきょう很高的てき頻しき寬ひろし；
Hadoop YARN – （於2012年ねん引入）一個負責管理叢集中計算資源，並なみ實現じつげん用よう戶と程ほど式しき排はい程ほど的てき平台ひらだい^[6]^[7]；
Hadoop MapReduce – 用よう於大おだい規模きぼ數すう據よりどころ處理しょり的てきMapReduce計算けいさん模型もけい實現じつげん；
Hadoop Ozone – （於2020年ねん引入） Hadoop的てき對象たいしょう儲もうか存そん。

Hadoop 一詞通常代指其基本模組和子模組以及生態系統^[8]，或ある可か以安裝そう在ざい Hadoop 之の上うえ的てき軟件套件的てき集合しゅうごう，例れい如Apache Pig、Apache Hive、Apache HBase、Apache Phoenix、Apache Spark、Apache ZooKeeper、Cloudera Impala、Apache Flume、Apache Sqoop、Apache Oozie和わApache Storm^[9]。

Apache Hadoop的てきMapReduce和わHDFS模も組ぐみ的てき靈感れいかん來らい源げん於Google的てきMapReduce和わGoogle File System論文ろんぶん^[10]。

Hadoop 框かまち架か本身ほんみ主要しゅよう是ぜ用ようJava程ほど式しき語ご言げん編へん寫うつし的てき，也包括ほうかつ了りょう一いち些C語ご言げん編へん寫うつし的てき本ほん機き代だい碼和Shell指令しれい碼編へん寫うつし的てき命令めいれい列れつ實用じつよう程ほど式しき。儘管MapReduce Java代だい碼很常見つねみ，但ただし任にん何程なにほど式しき語ご言げん都と可か以與Hadoop Streaming一起使用來實現用戶程式的map和わreduce部分ぶぶん^[11]。Hadoop 生態せいたい系統けいとう中ちゅう的てき其他專せん案あん實現じつげん了りょう更さら為ため豐富ほうふ的てき用よう戶と介かい面めん。

主要しゅよう子こ專せん案あん

Hadoop Common：在ざい0.20及以前まえ的てき版本はんぽん中ちゅう，包含ほうがんHDFS、MapReduce和かず其他專せん案あん公共こうきょう內容，從したがえ0.21開始かいしHDFS和わMapReduce被ひ分離ぶんり為ため獨立どくりつ的てき子こ專せん案あん，其餘內容為ためHadoop Common
HDFS：Hadoop分ぶん佈式檔案系統けいとう（Distributed File System）－HDFS（Hadoop Distributed File System）
MapReduce：平行へいこう計算けいさん框かまち架か，0.20前ぜん使用しようorg.apache.hadoop.mapred舊きゅう介かい面めん，0.20版本はんぽん開始かいし引入org.apache.hadoop.mapreduce的てき新しんAPI

知名ちめい用よう戶と

Hadoop在ざいYahoo!的てき應用おうよう

2008年ねん2月がつ19日にち，雅まさ虎とら使用しよう10,000個こ微ほろ處理しょり器き核心かくしん的てきLinux 電腦でんのう叢くさむら集しゅう運行うんこう一いち個こHadoop應用おうよう程ほど式しき。^[12]

其他用よう戶と

其他知名ちめい用よう戶と包括ほうかつ^[13]：

Hadoop與あずかSun Grid Engine

昇のぼり陽よう電腦でんのう的てきSun Grid Engine可か以用來らい排はい程ほどHadoop Job。^[14]^[15]

Hadoop與あずかCondor

威い斯康辛からし大學だいがく麥むぎ迪すすむ遜へりくだ分校ぶんこう的てきCondor計算けいさん機き叢くさむら集しゅう軟件也可以用作さくHadoop Job的てき排はい程ほど。^[16]

參まいり見み

大數たいすう據よりどころ
雲くも端はし運算うんざん
高こう效能こうのう計算けいさん叢くさむら集しゅう
OpenStack－以Apache特許とっきょ條じょう款特許とっきょ的てき雲くも端はし運算うんざん軟件。
Apache Spark

參考さんこう文獻ぶんけん

^ Hadoop Releases. apache.org. Apache Software Foundation. [2019-04-28]. （原始げんし內容存そん檔於2019-04-28）.
^ Release 3.4.0 available. [2024年ねん4月がつ10日とおか].
^ Welcome to Apache Hadoop!. hadoop.apache.org. [2016-08-25]. （原始げんし內容存そん檔於2017-09-23）.
^ Malak, Michael. Data Locality: HPC vs. Hadoop vs. Spark. datascienceassn.org. Data Science Association. 2014-09-19 [2014-10-30]. （原始げんし內容存そん檔於2017-09-10）.
^ Wang, Yandong; Goldstone, Robin; Yu, Weikuan; Wang, Teng. Characterization and Optimization of Memory-Resident MapReduce on HPC Systems. 2014 IEEE 28th International Parallel and Distributed Processing Symposium. IEEE. October 2014: 799–808. ISBN 978-1-4799-3800-1. S2CID 11157612. doi:10.1109/IPDPS.2014.87.
^ Resource (Apache Hadoop Main 2.5.1 API). apache.org. Apache Software Foundation. 2014-09-12 [2014-09-30]. （原始げんし內容存そん檔於2014-10-06）.
^ Murthy, Arun. Apache Hadoop YARN – Concepts and Applications. hortonworks.com. Hortonworks. 2012-08-15 [2014-09-30]. （原始げんし內容存そん檔於2017-09-11）.
^ Continuuity Raises $10 Million Series A Round to Ignite Big Data Application Development Within the Hadoop Ecosystem. finance.yahoo.com. Marketwired. 2012-11-14 [2014-10-30]. （原始げんし內容存そん檔於2017-09-10）.
^ Hadoop-related projects at. Hadoop.apache.org. [2013-10-17]. （原始げんし內容存そん檔於2017-09-23）.
^ Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. John Wiley & Sons. 2014-12-19: 300 [2015-01-29]. ISBN 9781118876220.
^ nlpatumd; Adventures with Hadoop and Perl. Mail-archive.com. 2010-05-02 [2013-04-05]. （原始げんし內容存そん檔於2017-08-14）.
^ Yahoo! Launches World's Largest Hadoop Production Application (Hadoop and Distributed Computing at Yahoo!). [2008-09-04]. （原始げんし內容存そん檔於2008-05-14）.
^ PoweredBy. [2008-09-07]. （原始げんし內容存そん檔於2012-11-29）.
^ Creating Hadoop pe under SGE. Sun Microsystems. 2008-01-16 [2008-09-04]. （原始げんし內容存そん檔於2008-09-12）.
^ HDFS-Aware Scheduling With Grid Engine (PDF). Sun Microsystems. 2009-09-10. ^{[永久えいきゅう失效しっこう連結れんけつ]}
^ Condor integrated with Hadoop's Map Reduce (PDF). 威い斯康辛からし大學だいがく麥むぎ迪すすむ遜へりくだ分校ぶんこう. 2010-04-15 [2011-03-15]. （原始げんし內容存そん檔 (PDF)於2011-04-01）.

外部がいぶ連結れんけつ

Hadoop官かん方かた網もう站（頁ぺーじ面めん存そん檔備份，存そん於互聯網もう檔案館かん）

[1] Hadoop Releases. apache.org. Apache Software Foundation. [2019-04-28]. （原始げんし內容存そん檔於2019-04-28）.

[wikidata-c8920ace5906148ec820fd4af51dc64af7c873c0-v3-2] Release 3.4.0 available. [2024年ねん4月がつ10日とおか].

[homepage-3] Welcome to Apache Hadoop!. hadoop.apache.org. [2016-08-25]. （原始げんし內容存そん檔於2017-09-23）.

[4] Malak, Michael. Data Locality: HPC vs. Hadoop vs. Spark. datascienceassn.org. Data Science Association. 2014-09-19 [2014-10-30]. （原始げんし內容存そん檔於2017-09-10）.

[5] Wang, Yandong; Goldstone, Robin; Yu, Weikuan; Wang, Teng. Characterization and Optimization of Memory-Resident MapReduce on HPC Systems. 2014 IEEE 28th International Parallel and Distributed Processing Symposium. IEEE. October 2014: 799–808. ISBN 978-1-4799-3800-1. S2CID 11157612. doi:10.1109/IPDPS.2014.87.

[6] Resource (Apache Hadoop Main 2.5.1 API). apache.org. Apache Software Foundation. 2014-09-12 [2014-09-30]. （原始げんし內容存そん檔於2014-10-06）.

[7] Murthy, Arun. Apache Hadoop YARN – Concepts and Applications. hortonworks.com. Hortonworks. 2012-08-15 [2014-09-30]. （原始げんし內容存そん檔於2017-09-11）.

[8] Continuuity Raises $10 Million Series A Round to Ignite Big Data Application Development Within the Hadoop Ecosystem. finance.yahoo.com. Marketwired. 2012-11-14 [2014-10-30]. （原始げんし內容存そん檔於2017-09-10）.

[9] Hadoop-related projects at. Hadoop.apache.org. [2013-10-17]. （原始げんし內容存そん檔於2017-09-23）.

[10] Data Science and Big Data Analytics: Discovering, Analyzing, Visualizing and Presenting Data. John Wiley & Sons. 2014-12-19: 300 [2015-01-29]. ISBN 9781118876220.

[11] tumd; Adventures with Hadoop and Perl. Mail-archive.com. 2010-05-02 [2013-04-05]. （原始げんし內容存そん檔於2017-08-14）.

[12] Yahoo! Launches World's Largest Hadoop Production Application (Hadoop and Distributed Computing at Yahoo!). [2008-09-04]. （原始げんし內容存そん檔於2008-05-14）.

[13] PoweredBy. [2008-09-07]. （原始げんし內容存そん檔於2012-11-29）.

[14] Creating Hadoop pe under SGE. Sun Microsystems. 2008-01-16 [2008-09-04]. （原始げんし內容存そん檔於2008-09-12）.

[15] HDFS-Aware Scheduling With Grid Engine (PDF). Sun Microsystems. 2009-09-10. ^{[永久えいきゅう失效しっこう連結れんけつ]}

[16] Condor integrated with Hadoop's Map Reduce (PDF). 威い斯康辛からし大學だいがく麥むぎ迪すすむ遜へりくだ分校ぶんこう. 2010-04-15 [2011-03-15]. （原始げんし內容存そん檔 (PDF)於2011-04-01）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

閱論ろん編へん Apache軟件基金ききん會かい
頂いただき級きゅう專せん案あん	Abdera（英語えいご：Apache Abdera） Accumulo（英語えいご：Apache Accumulo） ActiveMQ Ambari（英語えいご：Apache Ambari） Ant Aries（英語えいご：Apache Aries） Apache Arrow Apache HTTP Server APR Avro Axis Axis2 Beam Bloodhound（英語えいご：Apache Bloodhound） Apache Brooklyn（英語えいご：Apache Brooklyn） Buildr（英語えいご：Apache Buildr） Calcite（英語えいご：Apache Calcite） Camel Cassandra Cayenne（英語えいご：Apache Cayenne） Chemistry（英語えいご：Apache Chemistry） CloudStack（英語えいご：Apache CloudStack） Cocoon（英語えいご：Apache Cocoon） Continuum（英語えいご：Apache Continuum） Cordova CouchDB cTAKES（英語えいご：cTAKES） CXF Deltacloud（英語えいご：Deltacloud） Derby Directory（英語えいご：Apache Directory Server） Drill（英語えいご：Apache Drill） Empire-db（英語えいご：Apache Empire-db） ECharts Felix（英語えいご：Apache Felix） Flex Flink Flume（英語えいご：Apache Flume） Forrest（英語えいご：Apache Forrest） Geronimo（英語えいご：Apache Geronimo） Gora（英語えいご：Apache Gora） Gump（英語えいご：Apache Gump） Hadoop Hama（英語えいご：Apache Hama） HBase Hive Jackrabbit（英語えいご：Apache Jackrabbit） James（英語えいご：Apache James） JMeter（英語えいご：Apache JMeter） Kafka Karaf（英語えいご：Apache Karaf） Kylin（英語えいご：Apache Kylin） Lucene Lenya（英語えいご：Apache Lenya） Mahout（英語えいご：Apache Mahout） Marmotta（英語えいご：Apache Marmotta） Maven MINA（英語えいご：Apache MINA） mod_perl（英語えいご：mod_perl） MyFaces（英語えいご：Apache MyFaces） Nutch（英語えいご：Apache Nutch） ODE（英語えいご：Apache ODE） OFBiz（英語えいご：Apache OFBiz） Oozie（英語えいご：Oozie） OpenEJB（英語えいご：Apache OpenEJB） OpenJPA（英語えいご：Apache OpenJPA） OpenNLP OpenOffice PDFBox（英語えいご：Apache PDFBox） Phoenix（英語えいご：Apache Phoenix） POI Pig（英語えいご：Pig (programming tool)） Pivot（英語えいご：Apache Pivot） Qpid（英語えいご：Apache Qpid） River（英語えいご：Apache River） Roller（英語えいご：Apache Roller） RocketMQ Samza（英語えいご：Apache Samza） ServiceMix（英語えいご：Apache ServiceMix） Shindig（英語えいご：Apache Shindig） Shiro Sling（英語えいご：Apache Sling） Spark Stanbol（英語えいご：Apache Stanbol） Storm SpamAssassin Sqoop Apache C++標準ひょうじゅん庫こ（英語えいご：stdcxx） Struts Struts 2 Subversion Tapestry Thrift Tiles（英語えいご：Apache Tiles） Tika（英語えいご：Apache Tika） Tomcat Trafficserver Turbine Tuscany UIMA Velocity Wave Wicket Wink（英語えいご：Apache Wink） Xalan（英語えいご：Xalan） Xerces（英語えいご：Xerces） XMLBeans（英語えいご：XMLBeans） ZooKeeper
Commons專せん案あん	Apache Commons Logging（英語えいご：Apache Commons Logging） BCEL（英語えいご：Byte Code Engineering Library） BSF（英語えいご：Bean Scripting Framework） Commons Daemon（英語えいご：Commons Daemon） Jelly（英語えいご：Apache Jelly）
Lucene專せん案あん	Lucene Java Lucene.Net（英語えいご：Lucene.Net） Nutch（英語えいご：Nutch） Solr
Hadoop專せん案あん	HBase HDFS
其他專せん案あん	Batik Chainsaw（英語えいご：Chainsaw (log file viewer)） FOP Log4j XAP（英語えいご：Apache XAP） Log4Net Ivy（英語えいご：Apache Ivy）
孵化ふか器き專せん案あん	XAP（英語えいご：Apache XAP） Samza（英語えいご：Apache Samza） Storm
Apache Attic	AxKit（英語えいご：AxKit） Beehive（英語えいご：Apache Beehive） Click（英語えいご：Apache Click） Apache BlueSky（英語えいご：BlueSky Open Platform） Cactus（英語えいご：Jakarta Cactus） Jakarta Excalibur（英語えいご：Apache Excalibur） Harmony HiveMind（英語えいご：Apache HiveMind） Lenya（英語えいご：Apache Lenya） Slide（英語えいご：Jakarta Slide） Shale（英語えいご：Apache Shale） Shindig（英語えいご：Apache Shindig） stdcxx（英語えいご：Apache C++ Standard Library） iBATIS XMLBeans（英語えいご：XMLBeans）
特許とっきょ條じょう款標準ひょうじゅん	Apache特許とっきょ條じょう款
分類ぶんるい維基共用きょうよう