(Translated by https://www.hiragana.jp/)
データ (コンピュータ) - Wikipedia コンテンツにスキップ

データ (コンピュータ)

出典しゅってん: フリー百科ひゃっか事典じてん『ウィキペディア(Wikipedia)』
さまざまな種類しゅるいのデータがコンピュータ機器ききつうじて可視かしされる

コンピューティングでは、データえい: data)は、1つ以上いじょうシンボル記号きごう)の任意にんいならびである。データムえい: datum)は、単一たんいつ記号きごうからなるデータである[注釈ちゅうしゃく 1]。データが情報じょうほうばれるには解釈かいしゃくようする。デジタルデータとは、アナログ表現ひょうげんではなく、1(いち)と0(ぜろ)の二進法にしんほう使つかってあらわされるデータである。現代げんだい(1960ねん以降いこう)のコンピュータシステムでは、すべてのデータはデジタルである。

データは、保存ほぞんちゅう英語えいごばん転送てんそうちゅう英語えいごばん使用しようちゅう英語えいごばんの3つの状態じょうたい存在そんざいする。コンピュータないでデータは、たいてい並列へいれつデータとして移動いどうする。コンピュータとのあいだするデータは、たいてい直列ちょくれつデータとして移動いどうする。温度おんどセンサーなどのアナログ機器ききからおくられたデータは、アナログ-デジタル変換へんかんでデジタルに変換へんかんされる。コンピュータ操作そうさするりょう文字もじ、または記号きごうあらわすデータは、磁気じきてき英語えいごばん光学こうがくてき英語えいごばん電子でんしてき、または機械きかいてき記録きろく媒体ばいたい保存ほぞんおよび記録きろくされ、デジタル電気でんき信号しんごうまたはひかり信号しんごうとして伝送でんそうされる[1]。データは、周辺しゅうへん機器きき経由けいゆしてコンピュータに入出力にゅうしゅつりょくされる。

物理ぶつりてきコンピュータメモリ要素ようそは、データストレージのアドレスとバイト/ワード構成こうせいされる。デジタルデータはテーブル、あるいはSQLデータベースのようなリレーショナルデータベース格納かくのうされることがおおく、一般いっぱんてきに、抽象ちゅうしょうてきなキーとくみとしてあらわすことができる。データは、配列はいれつグラフオブジェクトなど、さまざまな種類しゅるいデータ構造こうぞう整理せいりすることができる。そしてデータ構造こうぞうには、数値すうち文字もじれつべつのデータ構造こうぞうなど、さまざまな種類しゅるいのデータを格納かくのうすることができる。

特徴とくちょう[編集へんしゅう]

メタデータは、データにかんするデータであり、データに意味いみあたえて情報じょうほう変換へんかんするのに役立やくだつ。メタデータは、暗黙あんもくてきであったり、指定していされたり、または付与ふよされる場合ばあいがある。

物理ぶつりてき事象じしょう過程かてい関連かんれんするデータには、時間じかんてき要素ようそふくまれる。この時間じかんてき要素ようそは、あんふくまれることもある。そのれいは、温度おんどロガー(自動じどう記録きろく)などの機器きき温度おんどセンサーからデータを受信じゅしんするときである。温度おんど受信じゅしんすると、そのデータは「いま」という時間じかんてき基準きじゅんつと想定そうていされる。そのため、機器きき日付ひづけ時刻じこく温度おんど一緒いっしょにして記録きろくする。データロガーが温度おんど通信つうしんする場合ばあい温度おんど測定そくていごとにメタデータとして日付ひづけ時刻じこく報告ほうこくする必要ひつようがある。

基本きほんてきに、コンピュータはデータのかたちあたえられた一連いちれん命令めいれいしたがって機能きのうする。あたえられたタスク(1つか複数ふくすう)を実行じっこうするための一連いちれん命令めいれいプログラムばれる。プログラムは、コンピュータやその機械きかい動作どうさ制御せいぎょするためのコードされた命令めいれいかたちをしたデータである[2]。コンピュータによって実行じっこうされるプログラムは、めい目的もくてきには機械きかいコードで構成こうせいされる。プログラムによって操作そうさされるが、中央ちゅうおう処理しょり装置そうち(CPU)によって実際じっさいには実行じっこうされない記憶きおく装置そうちうえ要素ようそもデータである。もっと本質ほんしつてきなところは、1つのデータムdatum)は特定とくてい場所ばしょ格納かくのうされたということにある。したがって、コンピュータプログラムがそのプログラムのデータを操作そうさすることによって、のコンピュータプログラムを操作そうさすることが可能かのうとなる。

データバイトをファイルに格納かくのうするためには、ファイル形式けいしき直列ちょくれつする必要ひつようがある。一般いっぱんにプログラムは、のデータようとはことなる特別とくべつなファイルタイプで保存ほぞんされる。実行じっこう可能かのうファイルにはプログラムがふくまれ、それ以外いがいのファイルはすべてデータファイルである。ただし、実行じっこう可能かのうファイルは、プログラムで使用しようするデータをふく場合ばあいもある(プログラムにまれる)。一部いちぶ実行じっこう可能かのうファイルはデータセグメント英語えいごばんち、名目めいもくじょう定数ていすう変数へんすう初期しょきふくまれているが、どれもデータとなすことができる。

プログラムとデータの境界きょうかいせん曖昧あいまい(あいまい)になることがある。たとえば、インタープリタはプログラムである。インタープリタへの入力にゅうりょくデータはそれ自体じたいがプログラムあり、ただ本来ほんらい機械きかい表現ひょうげんされていないだけである。インタープリタが解釈かいしゃくするプログラムは、人間にんげんめるテキストファイルであることがおおく、テキストエディタプログラムで操作そうさされる。同様どうように、メタプログラミングでは、プログラムがのプログラムをデータとして操作そうさするものがある。コンパイラリンカデバッガプログラムアップデータウィルススキャナなどのプログラムは、のプログラムをデータとして使用しようする。

たとえば、ユーザーはまず、あるファイルからワードプロセッサプログラムをロードするようオペレーティングシステム指示しじし、つぎ実行じっこうちゅうのプログラムを使用しようしてべつのファイルに保存ほぞんされている文書ぶんしょひらいて編集へんしゅうすることができる。このれいでは、文書ぶんしょはデータとなされる。ワードプロセッサがスペルチェッカそなえている場合ばあい、スペルチェッカの辞書じしょ単語たんごリスト)もデータとなされる。スペルチェッカーが修正しゅうせい提案ていあんするために使用しようするアルゴリズムは、機械きかいデータまたは解釈かいしゃく可能かのうプログラミング言語げんご記述きじゅつされたテキストデータのいずれかである。

べつ用法ようほうとして、ひとたいする可読かどくせいたないバイナリファイルを、ひとめるテキストファイル区別くべつして、データとぶこともある[3]

2007ねんのデジタルデータの総量そうりょうは、2,810おくギガバイト(281エクサバイト)と推定すいていされている[4][5]

データのキーと構造こうぞう永続えいぞくせい[編集へんしゅう]

データのキー(key)は、value)のコンテキスト(文脈ぶんみゃく)を提供ていきょうする。データの構造こうぞう関係かんけいなく、つねにキー要素ようそ存在そんざいする。データおよびデータ構造こうぞうにおけるキーは、データ意味いみたせるために不可欠ふかけつである。もしくは構造こうぞうない集合しゅうごう直接的ちょくせつてき間接かんせつてき関連かんれんするキーがないと、その無意味むいみとなり、データでなくなる。つまり、データとなされるには、構成こうせい要素ようそにリンクされたキーの構成こうせい要素ようそ必要ひつようである[よう出典しゅってん]

つぎれいのように、データはコンピュータのなかでさまざまな方法ほうほう表現ひょうげんされる。

RAM[編集へんしゅう]

  • ランダムアクセスメモリ(RAM)は、CPU直接ちょくせつアクセスできるデータを保持ほじする。CPUは、プロセッサレジスタまたはメモリないのデータのみを操作そうさすることができる。これは、CPUがストレージ機器きき(ディスクやテープなど)とメモリあいだのデータ転送てんそう指示しじする必要ひつようがあるデータストレージとは対照たいしょうてきである。RAMは、プロセッサがみまたは操作そうさのためのアドレスを提供ていきょうすることにより、みまたはみができる、直線ちょくせんじょう連続れんぞくした場所ばしょ配列はいれつである。プロセッサは、メモリない任意にんい場所ばしょを、いつでも、任意にんい順序じゅんじょ操作そうさすることができる。RAMでは、データの最小さいしょう要素ようそ進数しんすうビットである。RAMにアクセスするための機能きのう制限せいげんはプロセッサによってことなる。一般いっぱんに、メインメモリはアドレス 0(16進数しんすうの 0)からはじまる位置いち配列はいれつとして配置はいちされる。かく位置いちには、コンピュータ・アーキテクチャおうじて、一般いっぱんに8ビットあるいは32ビットを格納かくのうすることができる。

キー[編集へんしゅう]

  • データキーは、メモリじょう直接的ちょくせつてきなハードウェアアドレスをすものである必要ひつようはない。間接かんせつてき抽象ちゅうしょうてき、および論理ろんりてきなキーのコードを関連付かんれんづけて格納かくのうし、データ構造こうぞう形成けいせいすることができる。データ構造こうぞうには、その先頭せんとうから所定しょてい偏差へんさ(またはリンクやパス)があり、そこにデータ格納かくのうされる。したがって、そのデータキーは、構造こうぞうたいへのキーと、構造こうぞうたい内部ないぶでの偏差へんさ(またはリンクやパス)をくわえて構成こうせいされる。このような構造こうぞうかえして、おなかえ構造こうぞうないにデータとデータキーのくみ格納かくのうすると、そのかえ構造こうぞうかく要素ようそれつに、かくかえ構造こうぞうくだり見立みたてた、次元じげんひょうのような結果けっかるとかんがえることができる。このようなデータ編成へんせいでは、データキーは通常つうじょうれつの1つ(または複数ふくすうふくあい)になる。

編成へんせいされたかえしデータ構造こうぞう[編集へんしゅう]

  • かえしデータ構造こうぞうおもて形式けいしき表現ひょうげんすることは、おおくの可能かのうせいの1つにぎない。かえしデータ構造こうぞうはまた、ノード(ふし)が親子おやこ関係かんけいってたがいにリンクするように、階層かいそうてき編成へんせいすることもできる。これらのノードに、やより複雑ふくざつなデータ構造こうぞうがリンクされる。このように、ノード階層かいそうは、ノードに関連付かんれんづけられたデータ構造こうぞうあつかうためのキーを提供ていきょうする。この表現ひょうげんは、反転はんてんうえに、したけたがた)とかんがえることができる。たとえば、最近さいきんのコンピュータのオペレーティングシステムのファイルシステム一般いっぱんてきれいであり、XMLもそのひとつのれいである。

ならえデータまたは順序じゅんじょきデータ[編集へんしゅう]

  • データをあるキーでソート整列せいれつ)するといくつかの固有こゆう特徴とくちょうしょうじる。そのキーのサブセット(部分ぶぶん集合しゅうごう)のはすべていちぐんとしてあらわれる。おなじキーをつデータのグループが順次じゅんじ通過つうかするとき、あるいはキーのサブセットが変化へんかするとき、これをデータ処理しょり世界せかいではブレークあるいはコントロールブレーク英語えいごばんぶ。とくに、キーのサブセットじょうのデータ集計しゅうけい容易よういにする。

ペリフェラルストレージ[編集へんしゅう]

  • フラッシュメモリのようなだい容量ようりょう不揮発ふきはつせいメモリ登場とうじょうするまで、永続えいぞくてきなデータストレージは、磁気じきテープやディスクドライブのような外部がいぶブロックデバイスにデータをむことで実現じつげんされていた。これらの装置そうち通常つうじょう磁気じきメディアじょうのある位置いち磁気じきヘッドを移動いどうし、所定しょていのサイズのデータブロックきする。この場合ばあい、メディアじょう移動いどう位置いちがデータキーで、ブロックがデータとなる。初期しょきもちいられた「ロー・ディスク」データファイルシステムやオペレーティングシステムでは、ディスクドライブじょう連続れんぞくブロック英語えいごばんデータファイルようとして確保かくほした。このようなシステムでは、すべてのデータがまれるまえにファイルがいっぱいになり、データ領域りょういき不足ふそくすることがあった。そのため、かくファイルに十分じゅうぶん領域りょういき確保かくほするために、おおくの使用しようのデータ領域りょういき生産せいさんてき確保かくほされていた。そののファイルシステムでは、パーティション導入どうにゅうされた。それらは、ディスクのデータ領域りょういきをパーティションよう確保かくほし、必要ひつようおうじてパーティションのブロックをファイルに動的どうてきてることで、てられたブロックをより経済けいざいてき使用しようした。これを実現じつげんするために、ファイルシステムは、カタログまたはファイルアロケーションテーブルによって、データファイルによって使用しようまたは使用しようのブロックを追跡ついせきする必要ひつようがあった。これにより、ディスクのデータ領域りょういきをより有効ゆうこう活用かつようできるようになったが、ディスク全体ぜんたいでファイルの断片だんぺん発生はっせいし、データをむための移動いどう時間じかんえるために、パフォーマンスのオーバーヘッドが発生はっせいした。最近さいきんのファイルシステムは、断片だんぺんしたファイルを動的どうてきさい編成へんせいして、ファイルアクセス時間じかん最適さいてきする。ファイルシステムのさらなる発展はってんにより、ディスクドライブが仮想かそうされ、論理ろんりドライブを複数ふくすう物理ぶつりドライブからなるパーティションとして定義ていぎすることが可能かのうになった。

インデックスきデータ[編集へんしゅう]

  • おおきなデータセットからちいさなデータをすことは、逐次ちくじてきデータ検索けんさくともなうために効率こうりつてき場合ばあいがある。インデックス索引さくいん)とは、ファイル、テーブル、データセットなどのデータ構造こうぞうからキーと位置いちアドレスをうつり、反転はんてん構造こうぞう使つかってそれらを編成へんせいすることで、もとのデータのサブセットをすのにかかる時間じかん短縮たんしゅくする方法ほうほうである。そのためには、検索けんさく開始かいしするまえに、取得しゅとくするデータのサブセットのキーをっていなければならない。もっと一般いっぱんてきなインデックスは、Bツリー動的どうてきハッシュキーインデックス方式ほうしきである。インデックス作成さくせいは、データの整理せいり取得しゅとくのためのオーバーヘッドである。インデックスを構成こうせいする方法ほうほうほかにも、キーのソートや、二分にぶん探索たんさくアルゴリズムがある。

抽象ちゅうしょう間接かんせつ[編集へんしゅう]

  • オブジェクト指向しこうでは、データとソフトウェアを理解りかいするために2つの基本きほんてき概念がいねん使用しようする。
  1. プログラムコードクラス分類ぶんるいがくてきなランク構造こうぞう階層かいそうてきなデータ構造こうぞういちれい)。
  2. 実行じっこう作成さくせいされる、クラスライブラリからインスタンスされたオブジェクトのメモリないデータ構造こうぞうたいするデータキー参照さんしょう

インスタンスされたのちはじめて、指定していされたクラスの実行じっこうオブジェクトがあらわれる。オブジェクトのキー参照さんしょうNullになると、そのオブジェクトが参照さんしょうしているデータは(データキー参照さんしょうがNullになるため)データでなくなり、したがってそのオブジェクトも存在そんざいしなくなる。そのオブジェクトのデータが保存ほぞんされていたメモリ位置いちガベージばれ、さい利用りよう可能かのう使用しようメモリとして分類ぶんるいされる。

データベースデータ[編集へんしゅう]

並列へいれつ分散ぶんさんデータ処理しょり[編集へんしゅう]

  • 最新さいしんスケーラブル高性能こうせいのうなデータ永続えいぞく技術ぎじゅつは、こう帯域たいいきはばネットワークに接続せつぞくされた多数たすう量産りょうさんコンピュータあいだにまたがるちょう並列へいれつ分散ぶんさんデータ処理しょり依存いぞんしている。そのいちれいとしてApache Hadoopがあげられる。このようなシステムでは、データは複数ふくすうのコンピュータに分散ぶんさんされるため、システムない特定とくていのコンピュータを直接ちょくせつまたは間接かんせつてきにデータのキーであらわ必要ひつようがある。これにより、ことなるコンピューターで同時どうじ処理しょりされている2つのおなじデータセットを区別くべつすることができる。

関連かんれん項目こうもく[編集へんしゅう]

  • アセンブリ言語げんご - てい水準すいじゅんのプログラミング言語げんご
  • ビッグデータ - 従来じゅうらいのデータ処理しょりソフトウェアでは取扱とりあつかいが困難こんなん巨大きょだい複雑ふくざつなデータセット
  • バス - コンピュータない部品ぶひんあいだあるいはコンピュータあいだでデータを転送てんそうするための通信つうしんシステム
  • バイト - 一般いっぱんに8ビットで構成こうせいされるデジタル情報じょうほう単位たんい
  • コンピュータメモリ - コンピュータやデジタル電子でんし機器ききで、すぐに使用しようできるように情報じょうほう保存ほぞんする装置そうち
  • 中央ちゅうおう処理しょり装置そうち (CPU) - コンピュータ・プログラムを構成こうせいする命令めいれい実行じっこうする電子でんし回路かいろ
  • コンピュータネットワーク - 資源しげん共有きょうゆうするコンピュータの集合しゅうごう
  • CPUキャッシュ - CPUとコンピュータメモリのあいだ性能せいのうめるための高速こうそくなメモリ
  • データ - 個々ここ事実じじつ統計とうけい、または情報じょうほう項目こうもく (おおくの場合ばあい数値すうち)
  • データ辞書じしょ - データにかんする情報じょうほう意味いみのデータとの関係かんけい由来ゆらい使用しよう形式けいしきなど)を一元いちげん管理かんりするデータ構造こうぞう
  • データモデリング - 情報じょうほうシステムのデータモデルを作成さくせいする過程かてい
  • データストレージ - データを記録きろく媒体ばいたい保存ほぞんすること
  • ストリーム - 情報じょうほう伝達でんたつするためにデジタル符号ふごうされた一連いちれん信号しんごう送信そうしんすること
  • データがた - データのあつかわれかたをコンパイラやインタープリタにつたえる属性ぞくせい
  • データベース - 電子でんしてき保存ほぞんされアクセスされるデータの組織そしきてき集合しゅうごうたい
  • データセット - データのあつまり
  • デジタルデータ - 有限ゆうげんをとる離散りさんてき記号きごうれつとして表現ひょうげんされる情報じょうほう
  • 外部がいぶキー - テーブルの属性ぞくせいのうち、べつのテーブルのしゅキーを参照さんしょうするもの
  • ハッシュテーブル - キーと対応付たいおうづけてあつめて参照さんしょうできるよう整理せいりしたデータ構造こうぞう
  • 情報処理じょうほうしょりシステム - 情報じょうほうって、加工かこうしたり伝達でんたつおこなうシステム
  • 命令めいれいセット - コンピュータを抽象ちゅうしょうするモデル
  • メモリアドレス - ソフトウェアやハードウェアがさまざまなレベルで使用しようする特定とくていのメモリ位置いちへの参照さんしょう
  • オフセット - 配列はいれつまたはのデータ構造こうぞうオブジェクトのなかの、所定しょてい要素ようそまたは位置いちまでの、先頭せんとうからの距離きょりしめ整数せいすう
  • 単一たんいつキー - テーブルないすべてのくだりでキーが唯一ゆいいつである性質せいしつ
  • レジスタ - コンピュータのCPUが利用りようできる素早すばやくアクセスできる場所ばしょ
  • シフトレジスタ - フリップフロップをカスケードじょうならべたデジタル回路かいろ
  • ステート英語えいごばん - 先行せんこうするイベントやユーザとの対話たいわ記憶きおくした情報じょうほう
  • タプル - 要素ようそ有限ゆうげん順序じゅんじょリスト(れつ)
  • - プログラムによって操作そうさ可能かのうなんらかの実体じったい表現ひょうげん
  • ノイマンがたアーキテクチャ - 電子でんしデジタルコンピュータの設計せっけいアーキテクチャ (1945ねん)

脚注きゃくちゅう[編集へんしゅう]

注釈ちゅうしゃく[編集へんしゅう]

  1. ^ 英語えいごでは、data単数たんすうがた複数ふくすうがた、または可算かさん名詞めいしとしてあつかわれる。また、datumは、明示めいじてき単数たんすうがた意味いみする。

出典しゅってん[編集へんしゅう]

  1. ^ Data”. Lexico. 2019ねん6がつ23にち時点じてんオリジナルよりアーカイブ。2022ねん1がつ14にち閲覧えつらん
  2. ^ Computer program”. The Oxford pocket dictionary of current english. 2011ねん11月28にち時点じてんオリジナルよりアーカイブ。2012ねん10がつ11にち閲覧えつらん
  3. ^ file(1)”. OpenBSD manual pages (2015ねん12月24にち). 2018ねん2がつ5にち時点じてんオリジナルよりアーカイブ。2018ねん2がつ4にち閲覧えつらん
  4. ^ Paul, Ryan (2008ねん3がつ12にち). “Study: amount of digital info > global storage capacity”. Ars Technics. オリジナルの2008ねん3がつ13にち時点じてんにおけるアーカイブ。. https://web.archive.org/web/20080313111238/http://arstechnica.com/news.ars/post/20080312-study-amount-of-digital-info-global-storage-capacity.html 2008ねん3がつ13にち閲覧えつらん 
  5. ^ Gantz, John F. (2008ねん). “The diverse and exploding digital universe”. International Data Corporation via EMC. 2008ねん3がつ11にち時点じてんオリジナルよりアーカイブ。2008ねん3がつ12にち閲覧えつらん