今月Nature Communicationsに発表された論文によると、モノマーを操作する研究者らは、質量分析法とビット保存モノマーを使用して、マルチバイトのシーケンスを読み取ったという。
「プログラムされたバイト間フラグメンテーションによって促進される長いデジタルポリマーの質量分析による配列決定」と題されたこの研究論文は、現在のハードドライブの100分の1の規模でのデータ保存の基盤を築くと主張している。
この研究は、記憶媒体としての DNA と生物学的手法から、合成されより扱いやすいポリマーの使用へと進んでいます。
どうやって? 私たちが複雑な科学を手探りで理解していく間、化学者たちは席を外しておいてほしい。
基本的な記憶要素は合成モノマー、つまり分子であり、これが他の分子と結合してポリマーと呼ばれる鎖を形成します。DNAの場合、モノマーはヌクレオチドであり、これらは天然のものです。ここで合成されたモノマーは、中分解能質量分析法(MS)を用いて配列決定(分析)できるように設計されました。
データは、自動化されたモノマー - ポリマー製造方法を使用して「書き込まれ」、自動化されたホスホラミダイト化学によって組み立てられ、またはむしろ合成され、読み取り可能なデジタルシーケンス、つまりポリ (ホスホジエステル) チェーンになります。
モノマーは8個ずつの集合に分けられ、オリゴマー、つまりバイトとなります。モノマーは一夫一婦制ではなく、多妻制であることは明らかです。
容易に入手可能な質量分析計は、試料をイオン化します。これは電子衝撃などの手法を用いて行われ、元素の質量電荷比を示すチャートを用いて化学構造の特徴を示します。このチャート値(スペクトル)は、モノマーの同定に利用できます。
各モノマーはリン酸基と、それに関連付けられた二進法の1または0の値を持ちます。具体的には、モノマーはプロピルリン酸(二進法の0)または2,2-ジメチルプロピルリン酸(二進法の1)シントン(合成構成要素)のいずれかを含みます。
8つのモノマーの各セットは、分子セパレーターである弱いアルコキシアミン基によって次のグループから分離されています。さらに、シーケンスの各バイトには識別タグ(質量タグ)が付与されており、これはバイトシーケンスが存在し、検出可能であることを意味します。
このタグは、天然 (A、T、G、または C) または非天然 (B、I、F) ヌクレオチドです。
その後、モノマーは鎖状にグループ化され、室温で安定したポリマーを形成します。
データの読み取りでは、8ビットのモノマーシーケンス(バイト)をセパレーターポイントで分割し、シーケンス位置を検出可能なバイトの塊を生成します。次に、バイトを個別にシーケンス化します。つまり、構成モノマーを解析し、バイト内の位置を特定します。こうしてバイトのデジタル値が特定され、バイト列を再構成することでデジタルデータが得られます。
ASCII でエンコードされた単語「Sequence」を含む 8 バイトのデジタルポリマーの MS スペクトル。
研究者たちは、64ビット、7つのタグ、7つのスペーサーからなる78要素のポリマー鎖を読み取った。中程度の分解能の質量分析計を用いた1回の測定で、完全な配列カバレッジが得られると研究者らは述べている。
このようなバイト値の識別と配列の再構築は、実際には出力スペクトルを手作業で確認・分析することを意味し、これには数時間を要します。研究者らは、この作業を実行するソフトウェアを開発することで、必要な時間を数ミリ秒まで短縮できる可能性があると示唆しています。
これが実現可能で、合成ポリマーストレージデバイスを読み取りメカニズムの特性に応じてディスクドライブまたはより低速のテープドライブ速度で読み取ることができると仮定しますが、そのようなものの設計について考えるにはまだまだ遠い道のりです。
化学者たちは今や戻ってくるかもしれない。
問題
研究者らは、数百のコード化ビットを含む非常に長いポリマー鎖の合成には問題があると指摘している。
彼らは次のように述べています。「ポリマーベースのメモリデバイスは、DNAストレージの分野で既に行われているように、コード化された鎖のライブラリに依存する可能性が最も高いでしょう。このようなライブラリでは、通常、約100個のコード化残基と短い局在アドレス配列を含む個々の鎖が使用され、大量の情報を保存することができます。」
それは重複排除ハッシュ署名ライブラリを思い出させます。
より長期にわたるポリマーデータコーディング研究を実施するには、整理されアクセス可能なデジタルポリマーライブラリの開発が必要になります。
ポリマーストレージがディスクドライブの100分の1のサイズで実現できるという主張は、全く説得力がありません。3.5インチ、2.5インチ、それとも別のディスクドライブのフォームファクタの話でしょうか?
小型のUSBメモリなら、3.5インチのディスクドライブを搭載すれば、この基準を簡単に満たせるでしょう。もし研究者たちが、ポリマーストレージがディスクドライブのビットサイズの100分の1になる可能性があると言っているのであれば、それは興味深いですが、それほど大きな差ではありません。筆者はどのくらいのサイズのビットを想定しているのでしょうか?ディスクドライブのビットサイズはここ数年で著しく小型化しており、物理的なサイズは100分の1以上になっています。
筆者は、モノマーがディスクドライブのビットの100分の1の大きさだと言っているのだろうか?これはまた少し興味深い話だが、もう一度言うが、ディスクドライブのビットのどのサイズと比較すればいいのだろうか?この定量化されていないディスクドライブのサイズに関する主張は、それ自体では滑稽だ。
読み取りプロセス(MSシーケンシング)は、ポリマーがバイト(オリゴ)に分解され、バイトがビット(モノマー)に分解されるため、破壊的であるように思われます。ポリマーサンプルの採取を伴わない限り、研究者らはWOROストレージ(一度書き込み、一度読み取り)を発明したことになりますが、これはほとんど役に立ちません。
サンプル採取が必要な場合、元の材料が枯渇するまでにどれだけのサンプルを採取できるでしょうか?ここで示唆されているのは、ポリマーストレージの読み取り回数には限りがあり、WORFストレージ、つまりWrite Once, Read Few(一度書き込み、数回読み取り)は、既存の技術と比べても劣っており、理想からは程遠いということです。
ミリ秒クラスの読み取り速度も、テープ容量、信頼性、そして耐久性をそのようなディスクアクセス速度で実現できなければ、決して印象的とは言えません。今回の研究では8バイトの文字列を数時間で読み取ることができたため、その目標には程遠い状況です。
総じて、研究者たちは合成モノマー鎖のデジタルストレージというアイデアに夢中になっているものの、デジタルストレージ技術についてはほとんど知識のない洗練された化学者であるという印象を受ける。これは、彼らをデジタル合成モノマーストレージの好奇心の宝庫へと導く可能性がある。化学的には興味深いが、デジタル的には役に立たない。®
ブートノート:この研究は、ストラスブールのシャルル・サドロン研究所(CNRS)およびエクス=マルセイユ大学ラジカル化学研究所(CNRS/エクス=マルセイユ大学)を通じて、アブデルアジズ・アル・ワハビ、ジャン=アーサー・アマリアン、ローレンス・シャルル、ジャン=フランソワ・ルッツによって実施されました。この研究は、Nature Communications誌2017年10月17日号の論文967番「プログラムされたバイト間フラグメンテーションによって促進される長鎖デジタルポリマーの質量分析シーケンシング」に掲載されました。