NECは、高性能な重複排除ディスクバックアップボックスを持っていると述べ、40秒間ストレッチとあくびをした。

Table of Contents

NECは、高性能な重複排除ディスクバックアップボックスを持っていると述べ、40秒間ストレッチとあくびをした。

分析NECは、世界最大かつ最強のスケールアウト型重複排除ディスクバックアップアレイを保有していますが、その名を耳にすることはほとんどありません。IDCによると、NECは専用バックアップ製品サプライヤーのトップ6にも入っておらず、出荷台数でも売上高でもトップではありません。

しかし、1,100 社の顧客と 1,800 の導入があり、約 3 エクサバイトを管理しているにもかかわらず、世界は依然として過ぎ去っています。

1 ノードから 165 ノードまで拡張可能で、グローバル重複排除機能を備えています。これは、ディスク バックアップ市場のリーダーである EMC の Data Domain がこれまで実現できなかった機能であり、世界はうんざりしています。

なぜその技術についてはこれほど静かで、ほとんど口を閉ざしているのでしょうか?

同社は、世界市場に向けて多種多様なテクノロジー機器を製造・販売する、典型的な日本の巨大コングロマリットです。創業130年、従業員数は約99,000人、特許取得件数は64,000件を超え、世界中に9つの研究開発拠点を擁し、「より明るい世界を創造する」という、真面目でありながらもどこか空虚に聞こえる(イギリス人の耳には)企業理念を掲げています。

NECは、同社の技術革新により「人々がより明るい生活を送れるようになる」としている。

同社には、62億1600万ドルの通信部門、68億5000万ドルの公共部門事業、60億7000万ドルのシステムプラットフォーム事業、そしてわずか22億5000万ドルの小規模エンタープライズ事業がある。

NECは日立とは異なり、アメリカの経営と文化を持つHDS型の米国子会社を設立していません。日本型の経営と文化を持つNECコーポレーション・オブ・アメリカ(NECAM)を設立しました。

シリコンバレーの施設を訪れたプレス向けには、ITプラットフォームオペレーション担当バイスプレジデントの千田秀氏、プロダクトマネージャーの森田暢氏、そしてエグゼクティブプリンシパルエンジニア兼HYDRAstor CTOの水町宏明氏によるプレゼンテーションが行われ、同社の文化に触れることができました。米国とヨーロッパのスタッフも参加していました。

古くからある決まり文句を使うと、NEC の最大の強みはその日本的な経営と文化であり、最大の弱みは、静かで慎重かつ控えめなアプローチをとる日本的な経営と文化である、ということになります。

NEC の多数の「スマート エンタープライズ」製品には、ディスクおよびオールフラッシュ製品を含む M シリーズ SAN アレイ、WB シリーズ ファイバー チャネル スイッチ、および HYDRAstor として販売される HS シリーズ バックアップおよびアーカイブ ストレージ製品があります。

ハイドラスター

この製品は2002年に研究プロジェクトとしてスタートし、2006年にベータテスト期間を経て、2007年にHYDRA第1世代がリリースされました。その後、2008年にHYDRA2、2010年にMiniHYDRA (HS3)、2011年にHYDRA3、2013年にHYDRA4、2014年に第5世代、そして同年にアーカイブ専用のHS6と、着実に開発が進められました。HS6は重複排除転送によって46倍のパフォーマンス向上を実現しました。

この製品は、インライングローバル重複排除、オンラインノード拡張、NEC独自の消失訂正符号による保護、圧縮機能を備えたWAN最適化非同期レプリケーション、そして複数世代ノードのサポートを備えています。元々はハイパフォーマンスコンピューティング市場向けに設計されており、高速化のための並列データ取り込み機能を備えています。

フロントエンド アクセス プロトコルには、NFS、CIFS、OST、UEI、REST などがあります。

NECは、ソフトウェアのみのバージョンであるHYDRAstor仮想アプライアンス(VA)をリリースしました。vSphereまたはHyper-V環境に導入でき、1TBから16TBまでのストレージをサポートします。リモートオフィスやブランチオフィスでの使用を想定しており、中央サイトへの災害復旧リンクも備えています。定価は2,000ドルからで、レプリケーション、暗号化、WORM、重複排除機能を含むすべてのソフトウェアが含まれています。

テクノロジー

このシステムは、ハイブリッドアクセラレータノード(x86サーバー)とストレージノードの2種類のノードで構成され、パフォーマンスと容量を独立して拡張できます。ストレージノードは現在6TBのSATAドライブを使用しています。データ保護には、NEC独自の消失訂正符号技術を搭載したオブジェクトストレージを採用しています。重複排除は全ノードの全データに適用されます。分散ハッシュテーブルを採用しており、重複排除とハッシュテーブル処理はノードの追加に応じて線形に拡張されます。

データが配列に入ると何が起こるか見てみましょう。

まず、可変ブロック サイズを使用して重複排除されており、NEC は、HYDRAstor は単一コントローラで最速レベルの書き込み速度 63TB/時を誇り、システムとしては 5.2PB/時の速度を持つ他のどの製品よりも 25 倍高速であると主張しています。

消失訂正符号化原理

消失訂正符号化の原理

次に、コーシーベースのリード・ソロモン符号を用いて消失訂正符号化されます。つまり、データはフラグメントに分割され、数学的に処理されて、保護対象となるドライブ障害の数と同じ数の冗長フラグメントが生成されます。入力データが10個のフラグメントに分割され、さらに6個の保護フラグメントが追加され、合計16個のフラグメントが16個の個別のドライブまたはノードに書き込まれる場合、6個のドライブ障害が発生してもすべてのデータが回復可能です。

この数学的処理は前方誤り訂正(FEC)と呼ばれ、通常はリード・ソロモン符号化に基づいています。同数のドライブ障害から保護するRAID方式よりも、データオーバーヘッドが少なくなります。注目すべき2つのパラメータは、消失訂正コードの計算とデータ復元にかか​​るCPU負荷と、元のデータに追加されたフラグメントを保存するための追加のディスク容量というオーバーヘッド負荷です。

NECによると、HYDRAstor(Distributed Resilient Data)方式は他の消失訂正符号化方式よりも効率的です。ドライブ/ノード障害からの復旧時間は、RAIDの10~50倍高速です。デフォルト設定では、3台のドライブ障害まで保護され、容量オーバーヘッドは25%ですが、6台まで、または1台まで増減できます。アプリケーションに応じて異なる復元レベルを設定できます。レベル3(データフラグメント9個、パリティフラグメント3個)では、RAID 6の1.5倍の保護性能が得られ、オーバーヘッドは低減し、復旧も高速化されるとNECは述べています。

この技術では、受信データがサブスペースという概念に基づいて分散され、ディスク上のログ型バケットに書き込まれます。ノードは複数のサブスペースを持つことができます。(この技術の詳細については、特許US 8090792 B2をご覧ください。)

大規模システムのお客様

HYDRAstor はどれほど優れているのでしょうか? NECAM では銀行名が公表されていませんが、FNB と思われる南アフリカの銀行が、12 台の DD890 と 6 台の DD990 の Data Domain システム、および 6 台の 5330 NetBackup Appliance を HYDRAstore 実装に置き換えました。

米国に拠点を置く Global Payments は、2010 年に LTO テープから 18 個の HYDRAstore ノードに変更しました。現在は複数のデータ センターにまたがって 108 個のノードを保有しています。

NECAMが最も大きな成功を収めるのは、既存のData Domainやその他のディスクバックアップシステムが顧客データの増加に対応できなくなった時だと私たちは考えています。さらに、この機能でこれほど高い拡張性を備えた製品は他に類を見ません。日立データシステムズは2014年にHYDRAstorの競合企業であったSepatonを買収しました。現在はHitachi Protection Platformという名称で、重複排除とレプリケーション機能に特化しており、RAID 6 [PDF] はサポートしていますが、消失訂正符号はサポートしていません。

HDS はホワイト ペーパー [PDF] の中で、グリッド スケーラブルなアーキテクチャにより「パフォーマンスと容量の両方において比類のない拡張性」を実現し、「業界で最も強力かつ柔軟なデータ保護プラットフォーム」であると主張しています。

ハイエンドのディスクベースのバックアップおよびアーカイブ スケールアウト システムをお探しの場合は、HYDRAstor または HDS システムが主な 2 つの選択肢であり、消失訂正符号を使用すると NEC が選ばれるでしょう。®

Discover More