IBM には、統合サーバー、並列ファイル システム ストレージ、ネットワーク スイッチ、および MapReduce ベースのワークロードを実行するために必要なソフトウェアを含むクラスターである、パッケージ化された IBM Data Engine for Analytics – Power Systems Edition があります。
これは、ビッグデータ関連のワークロードをより簡単に、より高いパフォーマンスで実行することをサポートするテクニカル コンピューティング アーキテクチャとして説明されています。
IBMは、クラスターストレージとデータノードを関連付けるスケールアウト・アーキテクチャの代替として、共有ストレージ・モデルの使用を提案しています。これにより、ストレージとコンピューティング・リソースを完全に独立して拡張できるようになるとのことです。
このモデルは、Big BlueのElastic Storage Server(ESS)を使用します。ESSは、サーバー、ストレージエンクロージャー、ディスク、Spectrum Scaleソフトウェアを含む統合ストレージシステムです。IBMのマーケティング用語では、「Data Engine for Analyticsは、従来の記録システム(System of Record)のデータと、エンゲージメントシステム(System of Engagement)の新しい形式の非構造化データを連携させるプラットフォームを提供します」とされています。Data Engine for Analytics(DAE)は、インサイトシステム(System of Insights)です。
ビッグブルーは言う:
Spectrum Scale Native RAID では、クラスタ データが高レベルの消去コードを使用して管理され、複数のディスク障害から保護されると同時に、一般的な HDFS インストールで見られる 3 倍のレプリケーションよりもディスク容量を大幅に節約できます。ESS は、2 障害または 3 障害のディスク フォールト トレランスをサポートする、クラスタ化解除された RAID6 を使用してデータを保存します。ESS は、データとパリティ情報をシステム内のすべてのディスクに均等に分散します。これにより、ディスク障害によってトリガーされるストレージの再構築が、少数のディスクではなく多数のディスクに作業を分散することで、従来の RAID 再構築よりも速く完了します。
IBMの洞察システム
IBM の DAE ソフトウェアには次のものが含まれます。
- プラットフォーム クラスター マネージャー アドバンス エディション (PCM AE)
- InfoSphere BigInsights Enterprise Management には次のものが含まれます。
-
- マルチテナント向けSLAを備えたPlatform Symphony Advanced Edition
- スペクトラムスケール アドバンスエディション
- 標準的なオープンソースの Map-Reduce アプリケーションは、IBM Open Platform for Apache Hadoop を組み込むことで実現されます。
BigInsights Data Scientist または BigInsights Data Analyst をオプションで組み込むことで、追加の分析機能が利用できるようになります。
DAE図
Big Blueによると、ビッグデータ関連のワークロードをサポートするクラスターには、Hadoop分散ファイルシステム(HDFS)とMapReduceエンジンという2つの主要な要素があります。DAEは、IBMのBigInsights Enterprise Managementを使用してHDFSとMapReduce環境を実装します。
システム全体は、納品前にIBMデリバリーセンターで組み立て・設置され、付属ソフトウェアはすべてプリロードされています。これは、EMCのVCE統合システムの運用に似ています。オンサイトサービススタッフがお客様のデータセンターにシステムを統合します。
DAE ソフトウェア スタック。
IBM Data Engine for Analytics – Power Systems Editionは、この45ページのシステム・リファレンス・ガイドで詳細に解説されています。このアーキテクチャーで最初にサポートされるアプリケーション・パターンはMapReduceで、今後さらにワークフローが追加される予定です。®