维基百科 ひゃっか ,自由 じゆう 的 てき 百科 ひゃっか 全 ぜん 书
数 かず 据 すえ 科学 かがく (英語 えいご :data science )又 また 称 しょう 资料科学 かがく ,是 ぜ 一 いち 门利用 りよう 数 かず 据 すえ (资料)学 がく 习知识的學科 がっか ,其目标是透 とおる 过从数 すう 据 すえ 中 ちゅう 提 ひさげ 取出 とりで 有 ゆう 价值的 てき 部分 ぶぶん 来生 きすぎ 产数据 すえ 产品[ 1] ,学科 がっか 范围涵盖了 りょう :数 かず 据 すえ 取得 しゅとく 、数 かず 据 すえ 处理、数 かず 据 すえ 分析 ぶんせき 等 とう 过程,举凡与數 すう 據 よりどころ 有 ゆう 关的科学 かがく 均 ひとし 属 ぞく 数 すう 据 すえ 科学 かがく 。
数 かず 据 すえ 科学 かがく 结合了 りょう 诸多领域中 ちゅう 的 てき 理 り 论和技 わざ 术,包括 ほうかつ 应用数学 すうがく 、统计 、模 も 式 しき 识别 、机 つくえ 器 き 学 がく 习 、数 かず 据 すえ 可 か 视化 、数 かず 据 すえ 仓库 以及高性能 こうせいのう 计算 。数 かず 据 すえ 科学 かがく 透 とおる 过运用 よう 各 かく 种相关的数 すう 据 すえ 来 らい 帮助非 ひ 专业人士 じんし 理解 りかい 问题。
数 かず 据 すえ 科学 かがく 技 わざ 术可以帮助 すけ 我 わが 们如何 なん 正 せい 确的处理数 すう 据 すえ 并协助 すけ 我 わが 们在生物 せいぶつ 学 がく 、社会 しゃかい 科学 かがく 、人 ひと 类学等 とう 领域进行研究 けんきゅう 调研。此外,数 すう 据 すえ 科学 かがく 也对商 しょう 业竞争 そう 有 ゆう 极大的 てき 帮助[ 2] 。
美国 びくに 国家 こっか 标准技 わざ 术研究所 けんきゅうじょ 于2015年 ねん 发表七 なな 卷 かん 大數 たいすう 據 よりどころ 参考 さんこう 框 かまち 架 か (NIST Big Data Reference Architecture,NBDRA),于第一卷定义篇中将數據科學定为在理 り 论科学 かがく 、实验科学 かがく 和 わ 计算科学 かがく 之 これ 后 きさき 的 てき 第 だい 四 よん 科学 かがく 科学 かがく [ 3] [ 4] 。
数 かず 据 すえ 科学 かがく 家 か 是 これ 把 わ 统计学 がく 知 ち 识和计算机 つくえ 程 ほど 式 しき 设计知 ち 识相结合,并将其用于深度 しんど 分析 ぶんせき 数 すう 据 すえ 来 らい 获得数 すう 据 すえ 见解的 てき 职业[ 5] 。
1960年代 ねんだい ,彼 かれ 得 とく ·諾 だく 爾 なんじ 就首次 じ 提議 ていぎ 要用 ようよう 「數 すう 據 よりどころ 科學 かがく (data science、Datalogy)」來 らい 替 がえ 代 だい 「計算 けいさん 機 き 科學 かがく (computer science)」,後來 こうらい 在 ざい 上 うえ 世紀 せいき 九十年代中期為國際分類社團聯盟所用。
1997年 ねん 11月,吴建福 ぶく 发表了 りょう 题为“统计=数 かず 据 すえ 科学 かがく ?”的 てき 就任 しゅうにん 演 えんじ 讲,[ 6] 因 いん 为他被 ひ 任命 にんめい 为密 みつ 歇根大学 だいがく 的 てき H. C.卡弗教授 きょうじゅ 。[ 7]
在 ざい 这次演 えんじ 讲中,他 た 将 しょう 统计工作 こうさく 描述为数据 すえ 收集 しゅうしゅう 、数 かず 据 すえ 建 けん 模 も 和 わ 分析 ぶんせき 以及决策制定 せいてい 的 てき 三 さん 部 ぶ 曲 きょく 。 在 ざい 他 た 的 てき 结论中 ちゅう ,他 た 开创了 りょう “数 かず 据 すえ 科学 かがく ”(而非“计算机 つくえ 科学 かがく ”)这个术语的 てき 现代用法 ようほう ,并提倡将统计学 がく 重 じゅう 命名 めいめい 为数据 すえ 科学 かがく ,而统计学家 か 则应重 じゅう 命名 めいめい 为数据 すえ 科学 かがく 家 か 。[ 6]
后 きさき 来 らい ,他 た 发表了 りょう 题为“统计=数 かず 据 すえ 科学 かがく ?”的 てき 演 えんじ 讲,作 さく 为他1998年 ねん 的 てき 首 くび 个 P. C. 马哈拉 ひしげ 诺比斯纪念 ねん 演 えんじ 讲。[ 8] 这些讲座是 ぜ 为了纪念印度 いんど 科学 かがく 家 か 、统计学 がく 家 か 和 わ 印度 いんど 统计学院 がくいん (英 えい 语 ) 创始人 じん P. C. 马哈拉 ひしげ 诺比斯 (英 えい 语 ) 。
2001年 ねん ,William S. Cleveland 提議 ていぎ 將 はた 其設立 せつりつ 為 ため 一 いち 個 こ 新 しん 的 てき 學科 がっか ,吸收 きゅうしゅう 「計算 けいさん 在 ざい 數 すう 據 よりどころ 方面 ほうめん 取得 しゅとく 的 てき 進展 しんてん 」作為 さくい 統計 とうけい 學 がく 的 てき 延伸 えんしん 。《Data Science Journal》及《The Journal of Data Science》分別 ふんべつ 於2002年 ねん 與 あずか 2003年 ねん 發行 はっこう ;2005年 ねん 9月 がつ ,美国 びくに 国家 こっか 科学 かがく 基金 ききん 会 かい 發表 はっぴょう 了 りょう 《长存的 てき 数 すう 码数据 すえ 收集 しゅうしゅう :使 つかい 21世 せい 纪的研究 けんきゅう 与 あずか 教育 きょういく 成 なり 为可能 かのう 》,文 ぶん 中將 ちゅうじょう 數 すう 據 よりどころ 科學 かがく 家 か 定義 ていぎ 為 ため 「信 しん 息 いき 与 あずか 计算机 つくえ 科学 かがく 家 か ,数 すう 据 すえ 库与软件工程 こうてい 师与程 ほど 序 じょ 员,跨 またが 学科 がっか 专家,保管 ほかん 员以及专业注释者,图书馆员,档案馆员和 わ 其他人 たにん 员,这些人 じん 对数码数据 すえ 收集 しゅうしゅう 的 てき 成功 せいこう 管理 かんり 至 いたり 关重要 じゅうよう 。」[ 9]
2008年 ねん Jeff Hamerbatcher 與 あずか DJ Patil circa 分別 ふんべつ 在 ざい Facebook 、LinkedIn 領 りょう 導 みちびけ 全 ぜん 球 たま 第 だい 一支數據科學團隊,至 いたり 此數據 よりどころ 科學 かがく 越來 ごえく 越 えつ 被 ひ 廣 こう 泛流行 りゅうこう ,並 なみ 應用 おうよう 到 いた 公共 こうきょう 衛生 えいせい 、市場 いちば 、金融 きんゆう 、社會 しゃかい 等 とう 各個 かっこ 領域 りょういき 。
數 かず 據 よりどころ 科學 かがく 家 か 這個職位 しょくい 的 てき 頭 あたま 銜則是 ぜ 1997年 ねん 吴建福 ぶく 的 てき 报告 "Statistics = Data Science?"中 ちゅう 首 くび 次 じ 提 つつみ 及[來 らい 源 みなもと 請求 せいきゅう ] 的 てき ,他 た 認 みとめ 為 ため 數 かず 據 よりどころ 科學 かがく 家 か 就是能 これよし 夠從大型 おおがた 数 かず 据 すえ 集 しゅう 中 ちゅう 析取出 で 數 すう 據 よりどころ ,並 なみ 进行统计推断 すいだん 的 てき 统计学 がく 家 か 。
2009 年 ねん 1 月 がつ ,數 すう 位 い 化 か 數 すう 據 よりどころ 跨 またが 機構 きこう 工作 こうさく 組 ぐみ 發表 はっぴょう 了 りょう 一 いち 份名為 ため 《駕 が 馭科學 かがく 與 あずか 社會 しゃかい 數字 すうじ 化 か 數 すう 據 よりどころ 之 の 力 ちから 》的 てき 報告 ほうこく ,Sadkowsky 從 したがえ 中 ちゅう 了解 りょうかい 到 いた 「數 すう 據 よりどころ 科學 かがく 家 か 」這個詞 し ,認 みとめ 為 ため 該詞是 ぜ 自己 じこ 所 しょ 從事 じゅうじ 工作 こうさく 的 てき 最 さい 好 こう 描述。
2012年 ねん ,数 かず 据 すえ 科学 かがく 家 か 被 ひ 《哈佛商業 しょうぎょう 評論 ひょうろん 》称 しょう 为《二 に 十 じゅう 一世纪最性感的职业》[ 10] 後 ご ,數 かず 據 よりどころ 科學 かがく 逐漸成 なり 為 ため 一 いち 個 こ 時 どき 髦術語 ご (Buzzword )。
2017年 ねん ,由 ゆかり 資料 しりょう 科學 かがく 活動 かつどう 而衍生 せい 的 てき 資料 しりょう 經濟 けいざい ,也開始 かいし 被 ひ 關 せき 注 ちゅう 。與 あずか 資 し 訊經濟 けいざい 不同 ふどう 的 てき 是 ぜ ,資 し 訊經濟 けいざい 是 ぜ 由 よし 編 へん 譯 やく 過 か 的 てき 資料 しりょう 而產生 せい 經濟 けいざい 價 か 值,而資料 しりょう 經濟 けいざい 的 てき 資料 しりょう 價 か 值則源 げん 自 じ 於資料 しりょう 本身 ほんみ ,它可以不斷 ふだん 的 てき 被 ひ 編 へん 譯 やく 而產生 せい 多樣 たよう 化 か 的 てき 價 あたい 值。
数 かず 据 すえ 科学 かがく 家 か 在 ざい 美 び 欧 おう 的 てき 需求巨大 きょだい ,麥 むぎ 肯錫公司 こうし 宣布 せんぷ 全 ぜん 世界 せかい 上 じょう 此职业人才 じんさい 短 たん 缺 かけ 超 ちょう 过二 に 十 じゅう 万 まん 工 こう 人 じん [ 11] 。
^ Dhar, Vasant. Data Science and Prediction . [2014-07-14 ] . (原始 げんし 内容 ないよう 存 そん 档 于2014-11-09).
^ AOL staff. Data Scientist: The Hottest Job You Haven't Heard Of . [2014-07-14 ] . (原始 げんし 内容 ないよう 存 そん 档于2014-07-17).
^ 存 そん 档副本 ふくほん (PDF) . [2022-06-07 ] . (原始 げんし 内容 ないよう 存 そん 档 (PDF) 于2022-06-09).
^ 大数 たいすう 据 すえ , 2017, 3(4): 11-19 doi: 10.11959/j.issn.2096-0271.2017037
^ Davenport, Thomas H.; Patil, D. J. Data Scientist: The Sexiest Job of the 21st Century . Harvard Business Review. 2012-10-01 [2017-06-17 ] . ISSN 0017-8012 . (原始 げんし 内容 ないよう 存 そん 档 于2017-06-14).
^ 6.0 6.1 Wu, C. F. J. (1997). Statistics = Data Science? (PDF) . [9 October 2014] . (原始 げんし 内容 ないよう 存 そん 档 (PDF) 于2014-10-14).
^ Identity of statistics in science examined . The University Records, 9 November 1997, The University of Michigan. [12 August 2013] . (原始 げんし 内容 ないよう 存 そん 档于2013-10-29).
^ P.C. Mahalanobis Memorial Lectures, 7th series . P.C. Mahalanobis Memorial Lectures, Indian Statistical Institute. [18 Jul 2017] . (原始 げんし 内容 ないよう 存 そん 档于29 October 2013).
^ Long-Lived Digital Data Collections: Enabling Research and Education in the 21st Century. (PDF) . National Science Board, September 2005, National Science Foundation. [19 January 2020] . (原始 げんし 内容 ないよう 存 そん 档 (PDF) 于2017-05-05).
^ Data Scientist: The Sexiest Job of the 21st Century . [2017-06-17 ] . (原始 げんし 内容 ないよう 存 そん 档 于2017-06-14).
^ Big data: The next frontier for innovation, competition, and productivity . [2017-06-17 ] . (原始 げんし 内容 ないよう 存 そん 档 于2017-06-19).
基本 きほん 概念 がいねん 數學 すうがく 模型 もけい 學習 がくしゅう 範式 はんしき 主要 しゅよう 應用 おうよう 相關 そうかん 領域 りょういき