ハードウェア
SSDの寿命を知るためのSMART情報にはどんな項目があるのか?
近年は大容量のSSDドライブが登場したことから、PCのメインストレージはもっぱらHDDからSSDに移行しています。SSDはHDDよりも物理的な衝撃に強く読み書きも速いのが特徴ですが、SSDにも寿命が存在し、使用期間が長いほどSSDは消耗してしまいます。そんなSSDの状態を監視するための情報であるSelf Monitoring, Analysis, and Reporting Technology(SMART)について、クラウドストレージ企業のBackblazeが解説しています。
Making Sense of SSD SMART Stats
https://www.backblaze.com/blog/making-sense-of-ssd-smart-stats/
SSDがオフラインデータストレージとして使えるかどうかは長く議論されているところですが、Backblazeによると、「SSDが新品である場合は電源なしでも1年程度はデータを安全に保存可能」だとのこと。ただし、ドライブが消耗するにつれて、保存可能な期間は短くなっていきます。つまり、データを長期保存する上で、SSDの寿命と消耗度合は常にチェックする必要があります。
そんな時に役立つのが、早期発見・故障の予測を目的としてSSDの状態をリアルタイムで自己診断して数値化するSMARTです。Backblazeでは常に十数種類のSSDを稼働させており、それぞれのモデルからSMARTの情報を毎日取得し、SSDの消耗度合をチェックしているとのこと。Backblazeは、Seagate・Western Digital・Crucialの3社から出ているストレージ容量が250GBのSSDで、SSDの寿命を推測するのに必要なSMART情報をまとめています。
SMARTには255項目が存在し、今回比較した3つのSSDはそのうち44項目を表示することができます。しかし、示す項目やその内容についてはメーカーによってバラバラで、統一されていません。また、同じようなことをチェックしているにもかかわらず、項目が異なるケースもあるそうです。Backblazeは「メーカーが異なれば、基本的に同じことに対して異なる項目でチェックされます。これはSMARTの欠陥を浮き彫りにしています。メーカーは互いに仲良くしようとしていますが、誰がどの項目でどのようにチェックしているのかはメーカーの気まぐれや忍耐、粘り強さに左右されます」と述べています。
各ストレージで表示されるSMART情報44項目のうち、共通しているのは以下の5つだけ。
・SMART 9:Power-On Hours
電源が入っている状態の合計時間。
・SMART 12:Power Cycle Count
SSDの電源がオフになってから再びオンになった回数。これはSSDの生涯にわたって累積され、記録されます。
・SMART 194:Temperature
SSDの内部温度。
・SMART 173:SSD Wear Leveling
1ブロック当たりの最大消去回数
・SMART 174:Unexpected Power Loss Count
予期しないシャットダウンの回数。これはSSDの生涯にわたって累積され、記録されます。
また、メーカーによって読み取られるSMART情報は異なりますが、その中でも特にSSDの寿命を把握するために有用な項目が以下。見ると分かるとおり、表示している内容はほとんど同じですが、SMARTの項目番号と名前はメーカーによって異なります。なお、ページとはSSDを構成するNAND型フラッシュメモリで読み書きできる最小単位のことで、ページの集まりをブロックと呼びます。
・SMART 169:Remaining Lifetime Percentage (Western Digital)
SSDを構成するNAND型フラッシュメモリは、新しくデータを書き込むために既存のデータを一度消去しなければなりません。このデータを書き込むためにデータを消す「P/E(プログラム/消去)サイクル」という処理の回数には限界が存在します。また、SSDで書き込みができない不良ブロックができると、未使用の予備ブロックが割り当てられるのですが、この予備ブロックの残数もチェックされます。この項目では、P/Eサイクルと未使用の予備ブロック数からSSDの残された寿命を測定します。新品のSSDでは「100」の値が報告され、使用するにつれて「0」まで減少します。
・SMART 202:Percentage of Lifetime Used (Crucial)
SSDがあらかじめ指定された寿命のうち、どの時点でどのまでされたかを示します。新品のSSDの場合は「0」と表示され、指定された寿命に達すると「100」と表示されます。
・SMART 231:Life Left (Seagate)
P/Eサイクル、そして予備ブロックの数から、SSDのおおよその残り寿命を示します。新品のSSDの場合、正規化された値は「100」で、そこから減少し、「10」で交換の必要性があることを示されます。値が「0」の場合は、ドライブが読み取り専用モードで動作していることを意味します。
Logical Block Addressing(LBA)の書き込み・読み取りカウントは、まさに書き込みあるいは読み取りされたブロックをカウントしたものです。ブロックが書き込まれたり読み込まれたりするたびに、以下のような項目が1つずつ増加します。
・SMART 241:LBAs Written (Seagate・Western Digital)
LBA書き込みの総回数。
・SMART 242:LBAs Read (Seagate・Western Digital)
LBA読み込みの総回数。
・SMART 246:Cumulative Host Sectors Written (Crucial)
コンピューターの要求によって実行されたLBA書き込み。
そして、BakcblazeがたくさんのSSDを運用する上で、SSDの寿命を知る上で興味深いと考えられるSMART項目が以下だそうです。
・SMART 230:Drive Life Protection Status (Western Digital)
SSDの使用軌跡が、期待される寿命曲線を上回っているかどうかを示す項目。つまりメーカー側が想定している「SSDの理想的な消耗速度」に対して、現実はどれだけ消耗が進んでいるかを示す項目です。
・SMART 210:RAIN Successful Recovery Page Count (Crucial)
「RAIN」とはCrucialが開発した技術で、RAIDと似たような方法でデータの冗長性を確保します。ただし、この冗長性はある程度の容量を追加で消費する必要があります。この項目では、RAINを実現するために確保されているページ数が示されます。
・SMART 232:Endurance Remaining (Seagate・Western Digital)
SSDで設定された最大消去回数のうち、実際に完了した消去回数の割合。前述のSMART 231と似ていますが、こちらは予備ブロックを考慮していません。
・SMART 233:Media Wearout Indicator (Seagate・Western Digital)
実際にSSD上で行われたデータ消去回数の総回数。
・SMART 171:SSD Program Fail Count (Western Digital・ Crucial)
SSDが稼働してから累積されるページ書き込みの失敗回数。
・SMART 172:SSD Erase Count Fail (Western Digital・Crucial)
SSDが稼働してから累積されるページ消去の失敗回数。
また、Backblazeは以下の項目については何のために示されているのか、あるいは何を示しているのかはよくわからないと述べています。
・SMART 16:Total LBAs Read (Seagate)
項目名は「LBA読み込みの総回数」となっていますが、これは前述のSMART 242と同じ。おそらくSMART項目の名前を間違えているのではないかとBackblazeは推測しています。
・SMART 17:Unknown (Seagate)
Seagate製SSDのSMARTがこの項目を報告していることしか分かっておらず、何なのかは不明だとのこと。
・SMART 196:Reallocation Event Count (Crucial)
・SMART 197:Current Pending Sector Count (Crucial)
・SMART 198:Uncorrectable Sector Count (Crucial)
この項目はHDDの磁気ディスクに関係する項目であるため、SSDでこの項目が報告されるのは意味がないとBackblazeは述べています。
・SMART 206:Flying Height (Crucial)
「Flying Height」とは、HDDで使われる磁気ヘッドのディスクに対する浮上高のこと。当然SSDには磁気ヘッドが存在しないため、この項目が報告される意味はありません。
Backblazeは「SSDのメーカーがSMART情報にドライブモデルの状態や健康状態に関する関連情報を記録していることは素晴らしいことです。また、多くのメーカーがこれらのSMART情報を監視し、ユーザーフィードバックを提供するソフトウェアを提供していることも素晴らしいことです」と述べていますが、メーカーごとにチェックすべき項目がバラバラになっていることから、現場ではシステム管理の効率が下がっていると指摘。「SSDのSMARTをメーカー独自のものにするのではなく、すべてのSSDメーカーが準拠するようにSMARTの項目名と内容を全面的に標準化することを検討する時期なのかもしれません」と語りました。
なお、Backblazeがまとめた、SeagateとWestern DigitalとCrucialのSSDで示されるSMART情報の表は以下から見ることができます。
SMART Values in Use - various drives.xlsx - 2 - SSD+SMART+Stats+Comparison+Table.pdf
(PDFファイル)https://f001.backblazeb2.com/file/Backblaze_Blog/SSD+SMART+Stats+Comparison+Table.pdf
・関連記事
SSDの故障率をまとめた統計データ「メーカー・モデル別統計データ2022年版」をBackBlazeが公開 - GIGAZINE
SSDの故障率をまとめた統計データ「メーカー・モデル別統計データ2022年中間レビューSSD版」をBackblazeが公開 - GIGAZINE
「プログラム」「スレッド」「プロセス」という用語についてクラウドストレージ業者が解説 - GIGAZINE
SSDはSATAとNVMeのどちらを選べばよいのか? - GIGAZINE
大容量記録メディア「LTO-8テープ」が日本企業間の争いによって不足 - GIGAZINE
in ハードウェア, Posted by log1i_yk
You can read the machine translated English article here.