マイクロソフトのペリカンブリーフ、MAID in Azure*、フェムト秒レーザーガラスストレージ

Table of Contents

マイクロソフトのペリカンブリーフ、MAID in Azure*、フェムト秒レーザーガラスストレージ

分析先週、Microsoft Azure が MAID ディスク アレイを刷新する予定であると発表されたことを受けて、The Reg は深呼吸をして、Azure CTO の Mark Russinovich のプレゼンテーションに飛び込みました。

何が分かったでしょうか?IBMテープライブラリの使用、前述のPelican MAI、そして1インチ四方のガラス板に50TBのデータを保管する「Project Silica」というプロジェクトに関する興味深い情報がいくつかありました。ハイパースケールのアーカイブデータストレージと、その速度を最大化しコストを最小限に抑える方法についてです。

テープは今やアーカイブメディアとして主流ですが、アクセス速度が遅いという欠点があります。一方、ディスクアレイは、消費電力を削減できれば、テープと同等の所有コストで、より高速なデータアクセスを実現できます。そのため、PelicanはAzureアーカイブのニアラインディスクとテープの組み合わせとして活用できる可能性があります。しかし、テープやディスクよりも小さなスペースに多くのデータを保存し、永久に保存できる、より高密度の新しいメディアを発明できたらどうでしょうか?これが、テープに次ぐ新しいストレージ層であるSilicaプロジェクトの、遠い未来の夢です。

ルシノビッチ氏によると、マイクロソフトは現在、Azureアーカイブストレージの基盤としてIBM TS3500テープライブラリを採用している。Azure構成では、TS3500テープライブラリは1~16フレーム、最大72台の3592テープドライブ、12,000本のカートリッジ、そして1~2台のアクセサー(ロボット)を搭載している。

彼は容量については語っていないが、最大限に構成された TS3500 ライブラリーは、IBM の 3592 拡張カートリッジを 15,000 個以上使用して、最大 675PB の圧縮データを保存できる。

ペリカン概要

6年以上の開発期間を経たPelicanは、ディスク速度とテープ並みの経済性を兼ね備えているとされています。52Uの非標準ラックに、72個のドライブトレイ(6個×12列)を搭載できます。各トレイには、3.5インチディスクドライブが垂直にマウントされ、8個×2列で計16台搭載されています。合計1,152台のドライブを搭載し、10TBドライブを使用した場合の物理容量は11.52PBとなります。

ペリカン 収納ラック マイクロソフト

ラック全体の重量は1.36トン(3,000ポンド)と、まさにモンスター級の重量です*。これは基本的にデュアルコントローラのオブジェクトストレージシステムです。このMAID(Massive Array of Idle Disks)システムでは、常時アクティブにできるドライブは全体の8%、つまり92台のみに制限されています。これにより冷却負荷が軽減され、消費電力は3.5kWに抑えられています。コントローラ(2台のサーバー)はドライブの電源投入と切断をスケジュールし、IOリクエストキューに基づいて起動するドライブを選択します。

ラックは前面下部から背面上部にかけて冷却されます。ラックの上部と背面にあるディスクは、ラック内の他の場所にあるドライブよりも高温になります。

16 台のドライブの各トレイは電源ドメインであり、他の 14 台のドライブがスタンバイ モードの間、2 台のドライブがアクティブになるか、アクティブに移行できます。

ドライブへのアクセスは、トレイごとに1つずつ、計72個のSATA HBAに接続されたPCIeファブリックを介して行われます。これらのHBAは、トレイ内のドライブへのSATAパスを提供します。IO要求はデータの読み取り(get)または書き込み(put)を行い、40GigEリンクのペアを介してPelicanに送られます。

ドライブは24台のディスクを48セット(グループ)に分割されます。データ項目はブロブと呼ばれ、ブロブは18+3イレージャーコーディングを用いてグループ内の21台のディスクにストライプ化されます。ディスクにアクセスするには、グループ全体をスピンアップする必要があります。

2016年のMicrosoftの調査資料(PDF)によると、これらのドライブはアーカイブ用であり、パフォーマンスとコストのバランスが取れているとのこと。例として挙げられているのは、5,400rpmで回転するWestern DigitalのAeモデルWD6001F4PZ 6TBドライブと、SeagateのST8000AS0022です。

論文によると、「主要なHDDベンダー全てに説明を行い、そのうち1社とは緊密に連携して、これらの新しいHDDに求める性能を特定した」とのことです。ベンダー名は明らかにされていません。シングルドドライブと非シングルドドライブの両方が評価対象となりました。

Microsoft は 2015 年に Azure 運用環境に非シングル 4.9 TB ドライブを導入しました。

時代は変わり、テクノロジーは進歩します。Russinovich 氏のプレゼンテーションでは 10TB ドライブについて言及されました。

2017 年 5 月の YouTube ビデオでは、Pelican のデモが提供されており、Pelican ラックの容量は 11.5PB (生の) ではなく 5PB であると説明されています。

YouTubeビデオ

Microsoft は、Pelican を管理および操作するための GUI を開発しました。

ペリカン GUI マイクロソフト

クリックして拡大

3つのブロックの各行はトレイを表します。緑色の四角はアクティブなドライブ、灰色の四角は非アクティブなドライブ、茶色の四角は故障したディスクを表します。紫色の四角は、ディスクが存在しないことを示します。

右側の黄色のブロックは、IO キューと状態を表します。

Azureは、ファイル、ディスク、BLOB、アーカイブといった幅広いストレージタイプと階層を提供しています。BLOBストレージには、データへのアクセス頻度に応じて、ホット、クール、アーカイブの3つのストレージ階層があります。ホットストレージからクール、そしてアーカイブへと移行するにつれて価格は下がり、アーカイブストレージはクールストレージよりも50%安くなります。アーカイブストレージはアクセス頻度の低いBLOBストレージ向けで、アクセス時間は数時間単位です。

Microsoft は次のように述べています。「アーカイブ ストレージ内のデータを読み取るには、まず BLOB の層をホットまたはクールに変更する必要があります。このプロセスはリハイドレーションと呼ばれ、完了するまでに最大 15 時間かかる場合があります。」

IBMテープとPelicanアーカイブストレージの違いはここでは明らかにされていません。Russinovich氏のビデオによると、Azureのアーカイブストレージにはテープが使用されており、Pelicanはテープライブラリをサポートするには規模が十分でない地域で展開される予定です。

Microsoft が Pelican ベースのアーカイブ ストレージをテープ ベースのアーカイブ ストレージとは異なる価格で設定するかどうかはまだ明らかではありません。

プロジェクトシリカ

Project Silicaは、レーザー光を用いて石英ガラスキューブにデータを保存するマイクロソフトの研究プロジェクトです。マイクロソフトは、英国サウサンプトン大学オプトエレクトロニクス研究センターと共同で取り組んでいます。

石英ガラスの正方形にはボクセル(体積要素)が保存されています。これは3Dにおけるピクセルに相当するもので、ボクセルとはガラス内部の定義された体積領域です。6 x 6のボクセル配列は25ミクロン四方の領域を占め、ボクセル間の間隔は5ミクロンです。

プロジェクトシリカボクセル

プロジェクトシリカガラスのボクセル

ボクセルには層があり、ルシノビッチ氏は 5 層だと述べています。

ボクセルはフェムト秒レーザーを用いてガラスに「焼き付けられる」。フェムト秒レーザーとは、1000兆分の1秒単位で測定される光の閃光である。ボクセルのビット値は、レーザー光の位相差と偏光レベルに基づいて他のボクセルと区別される。CTOによると、この種のレーザーはガラスの破損を防ぐために使用される。

実際には、レーザーの位相差と偏光によって生成されたパターンがガラスのボクセル領域に刻み込まれ、一連のビット値を表します。マイクロソフトのゴールドパートナーであるNeroBlancoは、「約1インチ四方のガラス片に50TBのデータを保存できる」と推定しています。

私たちの理解では、Project Silica は WORM(Write Once Read Many)メディアであり、実用化には数年かかると思われます。ボクセルを正確に読み取るには、レーザー読み取りビームをボクセル上に配置する必要があるため、克服すべき課題があると考えられます。

プロジェクトシリカスライド

クリックして拡大

読み取りアクセス用のグラフィックでは、左側にボクセル配列が埋め込まれたシリカガラス板が見られます。中央の灰色の長方形は、複数のボクセル配列と25ミクロンの長さのガイドが示されたこれらのうちの1つを表しています。右側のデバイスは研究室のリーダーであり、ガラス板が挿入されていることを示しています。

読み取り・書き込み時間や、ボクセルスラブをリーダーに送る方法に関する情報はまだありません。この技術開発はまだ初期段階です。

プロジェクト・シリカの魅力は、ガラスが「永遠に」使えることだとルシノビッチ氏は言う。これは究極の長期保存装置となる可能性がある。これは、2009年に発表されたミレニアタ社の1000年記録可能なMディスクを彷彿とさせる。このブルーレイディスクには、4.7GB、25GB、50GB、100GBのバージョンがある。

プロジェクト・シリカは、今のところストレージ業界やユーザーに影響を与えていません。多くのサプライヤーや研究者が、特にホログラフィックディスク分野において、長寿命で大容量の光メディアの製造に取り組んできましたが、いずれも失敗に終わりました。500年以上の寿命を持つメディア分野では、ミレニアタのようなニッチなサプライヤーだけが生き残っています。

Microsoft は、非構造化データに対するパブリック クラウド ストレージの需要が今後数年間でエクサバイト領域にまで急上昇すると見込んでおり、Project Silica がそのストレージ需要を満たすことができると考えています。®

*以前のMAIDサプライヤーであるCopan社を破綻させたのは、そのアレイの重量でした。アレイは非常に重く、十分な強度のデータセンターフロアを持つ顧客が不足していました。

Discover More