(Translated by https://www.hiragana.jp/)
クラウドストレージ、特にオブジェクトストレージについて質問があります。 AWSを例に出すとS3への書き込み速度と読み込み速度はローカルのHDDとSSDの中間くらい出ている認識です。そのような性能を持っているのに25ドル/TBのような安価で提供できているのはどのような実装がされ… | mond

かる検索けんさくするとS3のレイテンシは1けたミリびょう帯域たいいきはクライアントがわのネットワークがボトルネックになるまで(つまり100Gbpsレベル)るようですね。しかも99.999999999%(11ナイン)の耐久たいきゅうせいという数字すうじ生半可なまはんか努力どりょくせる数字すうじではありません。

なぜそんな高速こうそくなストレージがこんなにやすいのかというのは一言ひとことでは「経済けいざいちから」となりますがもうすこみくといくつかの要素ようそがあります。

S3はまきえさかもれない

クラウドビジネス各社かくしゃではオンプレミスやコロケーションで顧客こきゃく自身じしん契約けいやくしている物理ぶつりハードウェアからサービスそのままで自社じしゃのクラウドじょうしてもらうこと、通称つうしょうリフトアンドシフトが基本きほん戦略せんりゃくひとつです。そのなかでデータ顧客こきゃく自社じしゃ管理かんりしているNASなどからS3にしてもらうのは重要じゅうようなマイルストーンです。S3にいてもらってそこからるなりくなりしてもらうのはクラウドを使つかんでもらうために重要じゅうよう起点きてんとなりますのでAWSはそのアップロードの敷居しきいげるためにSnowballなどのサービスを整備せいびしています。またS3にアップロードしたペタバイトクラスのデータをそとあらためてすのはとても大変たいへんなので、AWSにロックインさせること目的もくてきとしてS3は原価げんか以下いか価格かかく提供ていきょうしてもサービス全体ぜんたいでは投資とうし回収かいしゅうできるという目論見もくろみでいわゆるぎゃくザヤをやっているのではないかというせつもあります(実際じっさいところどうなっているかはりません)。とにかくそれぐらいやってもおかしくない戦場せんじょうがクラウドのオブジェクトストレージです。

帯域たいいきかねえる

S3を運用うんようするがわ一体いったいなんだいのコンピュータを使つかってサービスをまわしているかはまるでわかりません。ですがクラウド事業じぎょうしゃつデータセンターないデータ帯域たいいき市販しはんひんとはべつのライフサイクルで強化きょうかされつづけており、EC2でりれるマシンのなかには100Gbpsのネットワーク帯域たいいきものもあります。そしてハードディスクなどのストレージデバイスはクラウド事業じぎょうしゃ途轍とてつもない規模きぼうのでいわゆる電気でんき一般人いっぱんじん価格かかくくらべると圧倒的あっとうてきやすくなるとわれています。ですので「とにかく大量たいりょうのデータを保存ほぞんしたいから大量たいりょうのマシンを調達ちょうたつしてよこならべて負荷ふか分散ぶんさんしてするぞ!」と覚悟かくごさえめればハードウェアてきには25ドル/TB/つき実現じつげん可能かのう範囲はんいにあるとかんじます。もちろんソフトウェアや運用うんようのコストがかるのでゼロからクラウド事業じぎょうめたひとがおかねだけでどうにか解決かいけつできるとはおもいません。なににせよ、大量たいりょう調達ちょうたつによる仕入しい原価げんか削減さくげん重要じゅうよう要素ようそです。そしてサービスのインタフェースとしてはオブジェクトストレージなのでサーバ台数だいすう増加ぞうかさせることによる帯域たいいきはば拡大かくだい比較的ひかくてき自然しぜんおこなうことができます、いわゆるシャーディングですね。HDDはヘッドシークに10msほど時間じかんかってしまうのでそこが支配しはいこうにならざるをません、ですので可能かのうかぎ内部ないぶでは並列へいれつして帯域たいいきかせいでいます。

レイテンシは知恵ちえでしかえない

S3は公開こうかい情報じょうほうによると複数ふくすうのAZ(たとえばおな地域ちいきべつ建物たてものなど)につね複製ふくせいわってからはじめてクライアントに完了かんりょう返事へんじをする仕組しくみでその完了かんりょうレイテンシは10ms前後ぜんこうるようです。S3 Express One Zoneというストレージクラスを明示めいじてきえらぶことで一時いちじてき耐久たいきゅうせいすこ犠牲ぎせいにしてレイテンシを1けたミリびょうへと短縮たんしゅくすることができるといてあるので、そのあたりがアルゴリズムてき上限じょうげんっかかる境界きょうかいなのだと見受みうけられます。つまり顧客こきゃくからったデータを複数ふくすうのAZに複製ふくせいわるのをつかどうかですうmsの遅延ちえんるかいかがわってくるので最初さいしょ依頼いらいけたサーバはローカルにくかすぐとなりのマシンにもおくるかとうをして自身じしんそくクラッシュしてもデータが永続えいぞくされた状況じょうきょうつくことたか耐久たいきゅうせい実現じつげんしているとかんがえられます。

データを複製ふくせいするとってもナイーブな方法ほうほうでは故障こしょうよわいのでちゃんとアルゴリズムてきつよ検証けんしょうしたものを使用しようする必要ひつようがあり、形式けいしき手法しゅほうもちいて確認かくにんおこなったというはなしなどはさがすといくらかてきます。アルゴリズムやサービスのバリエーションなどの側面そくめんでもレイテンシをちぢめる工夫くふうらしているようです。

ぼく以下いかのブログをながみしかしていませんが、実態じったいないエンジニアリングの努力どりょくてにできているサービスであることをしみじみとかんじました。

https://highscalability.com/behind-aws-s3s-massive-scale/

Behind AWS S3’s Massive Scale

This is a guest article by Stanislav Kozlovski, an Apache Kafka Committer. If you would like to connect with Stanislav, you can do so on Twitter and LinkedIn. AWS S3 is a service every engineer is familiar with. It’s the service that popularized the notion of cold-storage to the

highscalability.com

7にち

利用りよう規約きやくプライバシーポリシー同意どういじょう利用りようください

熊崎くまざき 宏樹ひろきさんの過去かこ回答かいとう
    Loading...