テープ、ガラス、分子 - アーカイブストレージの未来

Table of Contents

テープ、ガラス、分子 - アーカイブストレージの未来

特集アーカイブ データ ストレージの将来はテープ、さらにテープ、そしておそらくガラス ベースのテクノロジであり、DNA やその他の分子テクノロジはまだ遠い展望です。

アーカイブストレージの役割は、数十年以上にわたる長期にわたって、データを確実かつ低コストで保存することです。現在、このための主な媒体はLTOテープですが、速度が遅く、寿命が限られており、画像や動画の解像度が上がり続け、AIを活用したデータ生成が進む中で、容量が十分ではありません。しかし、テープを大規模に代替する実用的な技術はまだ存在せず、可能性はあるものの、光ストレージはDNAやその他の分子ストレージよりも実用的で製品化が近いと言えるでしょう。

テープ制限

第10世代LTO(LTO-10)が発表されたストリーミングテープは、ますます不十分さに直面しています。ハードディスクやSSDに比べてテラバイトあたりのコストがはるかに低いため、アーカイブストレージとして最も普及している選択肢ですが、テープのコンテンツはビットの劣化を防ぐため、約5年ごとに新しいテープにコピーして書き込む(再シルバー化)必要があります。

Symply LTOテープライブラリ

Symply LTO-10 テーブルトップおよびラックマウント テープ ライブラリ

「磁気技術の寿命には限りがあります」と、Microsoft Project Silicaの特別エンジニア、アント・ロウストロン氏は語る。「新しい世代のメディアにコピーし続ける必要があります。ハードディスクドライブは5年は持つかもしれません。テープは、まあ、勇気があれば10年は持つかもしれません。しかし、その寿命が尽きたら、コピーしなければなりません。そして、率直に言って、私たちが消費する膨大なエネルギーと資源を考えると、これは困難であり、持続不可能な作業です。」

テープのアクセス速度は遅く、これはディスクやSSDとは異なり、テープドライブを介してストリーミングされながらシーケンシャルに読み取られるためです。ディスクやSSDはランダムアクセスが可能で、最初のバイトの読み取り速度がはるかに高速です。LTO-10のスループットは400MBpsで、これは18TB(RAW時)/45TB(圧縮時)の容量を持つLTO-9と同じです。LTO-10テープはLTO-9テープよりもデータ量が66.7%多いため、読み取りに時間がかかります。

テープリールの容量も、ディスクやSSDに遅れをとっています。最新のLTO-10は物理容量が30TBで、圧縮率2.5:1で75TBです。ディスクドライブは現在32~36TB程度で、40TBまで到達する予定です。SSDはすでにそれをはるかに上回っており、現在122TBのドライブが利用可能で、来年には256TBに達すると予測されています。テープ容量の増加率はそれに比べて緩やかで、次世代のLTO-11は2027~2028年頃に登場し、物理容量は最大72TBになると予想されています。その時点では、ディスクドライブの容量は約50TB、SSDは300TBを超えると予想されます。

しかし、テープはディスクやSSDよりもはるかに手頃な価格で、速度が遅く、容量が限られており、寿命も5~10年と短いものの、現在利用可能な最高のアーカイブメディアです。2035~36年頃まで4世代のロードマップがあり、ある程度の信頼性は確保できますが、より優れた技術が登場すれば、代替の時代が到来しています。代替候補として注目されているのは、ガラスベースと分子ベースの2つです。

ガラスアーカイブゲームとプロジェクトシリカ

MicrosoftのProject Silicaは、英国サウサンプトン大学が開発した技術を用いて、フェムト秒赤外線レーザーパルスによって生成される偏光ナノ構造を用いて、正方形のシリカガラスタブレットにデータを保存します。このガラスは熱、沸騰水、電磁波、様々な化学物質に対して耐性があり、表面の傷がデータ復旧に影響を与えることはありません。

プロジェクトシリカ

プロジェクトシリカガラスタブレット

位置、方向、サイズ、光の屈折によって定義されるナノ構造は、75×75×厚さ2ミリメートル(2.95×2.95×0.08インチ)のシリコンガラスタブレットに作成されます。研究者らはマイクロソフトの研究者と協力し、2019年に多層構造を用いて75.6GBのデータを格納しました。

サウサンプトンを拠点とする研究者たちは、シリカガラスに2つの光学的次元と3つの空間的次元を用いた5Dシステムを開発しました。フェムト秒レーザーパルスを用いてシリコンに130nmサイズのナノスケールの円形空隙または穴を焼き付け、微小爆発を引き起こしました。その後、パルスを照射して空隙の形状、サイズ、エッジを変化させることで、460×50nmのナノラメラ(ボクセル(体積ピクセル)と呼ばれるナノスケールの板状構造または格子)を作成しました。各ボクセルには4ビットが保存されます。

マイクロソフトによると、ドリンクコースターやDVDほどの大きさのProject Silicaガラスタブレットは、100層以上の層で7TBの生データを保存でき、数千年にわたってデータを保存できるという。同社はAzure AIを活用してガラスに保存されたデータを解読し、読み書き速度を向上させ、従来よりも多くのデータ保存を可能にするとしている。

データは次の 4 つのステップで保存されます。 

  • 超高速フェムト秒レーザーによる書き込み
  • ガラスを通して照射された偏光をコンピュータ制御の偏光感度顕微鏡で読み取る
  • 機械学習アルゴリズムによるデコード、偏光パターンの解釈
  • テープカートリッジのようにライブラリに保管する

図書館にはバッテリー駆動のロボットが配備されており、図書館内で待機中に充電し、データが必要になった時に起動します。ロボットは棚を登り、ガラスタブレットを拾い上げてリーダーまで運びます。システム上、データが保存されたタブレットは書き込みステーションに持ち込むことができません。タブレットは変更できないように設計されているからです。しかし、もし書き込みステーションに持ち込んだ場合、フェムト秒レーザーパルスによって保存データが破損する可能性があります。

プロジェクトシリカ

プロジェクトシリカの図書館ロボット2台

現状のタブレットの容量(テラバイト単位)や、読み書きスループット速度は不明です。Microsoftは「システムレベルの総合書き込みスループットは、現行のアーカイブシステムに匹敵する」と述べていますが、これはおそらくテープライブラリを指しており、「同等のシステムよりも高速」とは明確に述べていません。近い将来に提供が開始される兆候はなく、Project Silicaの製品提供開始は2~5年後になると予想されます。

Microsoftは、Project Silicaライブラリの低消費電力を強調し、持続可能性へのメッセージを打ち出しています。同社はProject Silicaを、Azureクラウドサービス向けのアーカイブストレージ開発の手段と位置付けています。つまり、Project SilicaはMicrosoft独自の技術であり、AWS、Google、Oracleなどのクラウドサービスで商用利用できるようになる可能性は低いでしょう。

持続可能性に重点を置くベンチャーグループであるElireは、Microsoft ResearchのProject Silicaチームと協力し、この技術をノルウェーのスヴァールバル諸島にあるGlobal Music Vaultに活用しています。Elireは、スヴァールバル諸島よりもアクセスしやすい世界各地に拠点を設立することで、この音楽リポジトリを拡大していく予定です。

セラバイト

Cerabyteのセラミックコーティングガラスは、ガラスタブレットに積層されたセラミック媒体にフェムト秒レーザーパルスがナノスケールのピットを焼き付けるという点で異なります。単層技術であるため、タブレットに保存できるデータはProject Silicaよりも少なく、1面あたり1GBです。しかし、物理的、化学的、電磁放射線攻撃に対する耐久性と耐性は同じです。物理的なストレージもロボットアクセス可能なテープ型ライブラリに収められており、データの書き込みと読み取りには2つの独立したステーションが備えられています。

セラバイト図

セラバイト図

Cerabyteのタブレットは、データをQR(クイックレスポンス)コード(二次元バーコード)に保存し、走査型顕微鏡で読み取ります。単層デバイスであるため、読み取りと書き込みはProject Silicaのプロセスよりもはるかに簡単です。Project Silicaのプロセスでは100層以上の層を処理する必要があり、レーザーと走査型顕微鏡の位置決め要件ははるかに厳密です。

同社は「1回のレーザーパルスで最大200万ビットの書き込みが可能で、超高速のデータ保存と高速カメラによる読み取りが可能」としているが、実際のスループットの数値は公表されていない。

セラバイトガラスキャリア

セラバイトガラスタブレット

プロジェクト シリカと同様に、テープとは異なり、保存されたタブレットは定期的な書き換えを必要としません。

Cerabyteは、In-Q-Tel、Pure Storage、Western Digitalからの投資を獲得しました。WDの最高戦略・コーポレート開発責任者であるShantnu Sharma氏は、「Cerabyteと協力し、この技術の商業化に向けた技術提携を構築することを楽しみにしています」と述べています。

Cerabyteは、コロラド州ボルダーにオフィスを構え、LTOテープライブラリサプライヤーのSpectraLogic社とQuantum社に近いことから、米国におけるロボットアーカイブライブラリ開発の中心に位置しています。Project Silicaと同様に、Cerabyteの製品化には2~5年かかると見込まれますが、その頃には商用化されるでしょう。

DNAファンタジー

科学者たちは、DNAの二重らせん構造に膨大な量の情報が保存されていることに気づいています。DNAは、シトシン(C)、グアニン(G)、アデニン(A)、チミン(T)の4つの核酸塩基のいずれかを含むヌクレオチドという化学分子で構成されています。DNAを構成するこれらの4つの文字はミニアルファベットを構成し、その組み合わせによってデータを保存することができます。ヌクレオチドは、ディスク、SSD、テープなどの磁気ビット領域よりもはるかに小さく、サプライヤーであるBiomemory社は、DNA 1グラムに45ゼタバイトのデータを格納できると主張しています。Biomemory社のDNAストレージアレイのコンセプトについては、こちらをご覧ください。

アーカイブ保存の観点から見ると、DNAは適切な条件下では数百年も保存可能です。そこが魅力ですが、実用的なDNAアーカイブ保存技術の開発は途方もなく困難です。なぜなら、DNAの書き込みと読み取りのメカニズムがひどく遅く複雑だからです。ここで問題となっているのは電気や磁気の反応ではなく化学反応であり、DNAストレージには、何百万もの断片に切り刻まれ、混ざり合ったテープリールに相当する情報が含まれることを認識する必要があります。

ラック型DNAデータストレージ

バイオメモリラック型DNAデータストレージ

入力データはDNAのアルファベットや構造の何らかの表現にコード化され、分子媒体に順番に書き込まれますが、この出力には固有の構造は全くありません。分子が小さなクラスターに集まり、液体の中を漂っているだけです。これらの断片を取り出し、配列することで、それぞれに含まれる小さな情報パケットを復元し、さらに断片からデータ全体を再構成する必要があります。これは、インターネットプロトコルのネットワークメッセージからパケットを受信し、順序を並べ替えるようなものです。

書き込まれたDNAは不変です。しかし、DNAストレージメディアの読み取りは破壊的です。複数回読み取るには十分な量のDNAが必要です。読み取り・書き込み装置は大型で、読み取り速度は極めて遅いです。中国の研究者たちは、メチル化DNA技術を用いて毎秒40ビットの速度でデータを書き込みました。LTO-9テープは毎秒400MB(3,200Mbps)でデータを書き込みます。これは、LTO-9テープの8,000万倍の速度です。

DNAストレージの書き込み速度が8000万倍も向上するなんて、10年も20年も経たないうちに想像もつかない。それは当面の科学的な夢物語だ。

  • マスク氏のDOGE、テープストレージのデタラメでXを黙らせる
  • ガラスの心臓:5Dメモリクリスタルに「永遠」に保存されたヒトゲノム
  • 特典映像:ソニーはブルーレイ技術を使って成層圏から宇宙への466Mbpsのレーザーリンクをシミュレートする
  • ソニーと富士フイルムのストレージ特許訴訟はすべて解決。LTO-8 はやらないよりはまし、そうだろ?

分子電気貯蔵

分子ストレージの別の概念として、シーケンス定義ポリマー(SDP)が挙げられ、テキサス州オースティン大学で研究されています。研究者たちはCell誌に掲載された論文の中で、「SDPはDNAに比べて優れた点がある。例えば、DNAは4つのモノマーしか使用できないのに対し、SDPは8つ、16つ、あるいはそれ以上のモノマーを使用できるため、より高い情報密度を実現できる」と述べています。

DNAシーケンシングは速度が遅く、データ保存には実用的ではないため、研究者らは本研究のために、プラスチックの一種である配列定義ポリマーを解読する電気化学的手法を発明した。配列構成要素は256個のASCII文字を表すために使用され、個々の電気信号を介して読み取られる。

テキサス大学の責任著者で電気工学者のプラビン・パスパシー氏は発表の中で次のように述べています。「分子は電力を必要とせずに非常に長期間情報を保存できます。自然は、これが機能するという原理的な証明を私たちに与えてくれました。これは、プラスチックの構成要素に情報を書き込み、その後電気信号を使って読み取るという初の試みであり、日常的な材料に情報を保存することに一歩近づくものです。」 

研究グループは概念実証実験を行い、11文字のパスワードを2時間半で読み取り・解読することに成功しました。論文の筆頭著者であり、テキサス大学の化学者であるエリック・アンスリン氏は、「私たちのアプローチは、従来の分光法ベースのシステムと比較して、より小型で経済的なデバイスにスケールダウンできる可能性があります。これは、化学エンコーディングと現代の電子システムやデバイスとのインターフェースにおける刺激的な展望を開くものです」と述べています。

DNAであれプラスチックであれ、これはまだ研究の最先端であり、商業化には程遠い。現時点でテープの代替として実現可能な技術は光学式のみであり、CerabyteとMicrosoftが開発を競っている。

マイクロソフトはCerabyteよりも高密度のガラスタブレットを製造していると主張しているが、その技術は社内利用に留める可能性がある。Cerabyteは商業的成功を望んでおり、PureとWestern Digitalに投資する価値があると説得した。テープライブラリシステムベンダーが関与すれば、Cerabyteの構想は実現に一歩近づくことになるだろう。®

Discover More