HPEのスーパーコンピューターは340日経ってもまだ宇宙で計算を続けている

Table of Contents

HPEのスーパーコンピューターは340日経ってもまだ宇宙で計算を続けている

昨年宇宙に打ち上げられたHPEのミニスーパーコンピューターは、ほぼ1年間、無重力と放射線の過酷な環境に耐えてきました。

Spaceborne Computer は最高のスーパーコンピュータではなく、パフォーマンスは 1 テラフロップスで、Red Hat Enterprise Linux 上で実行され、56Gbps の相互接続を備えた 2 台の HPE Apollo Intel x86 サーバーから構築されています。

NASAは、国際宇宙ステーション(ISS)内でコンピューターが火星到達にほぼ等しい1年間持続するかどうかを検証したいと考えていました。そこでHPEは、SpaceX社のCRS-12ロケットに自社のSpaceborne Computerを搭載し、宇宙の深淵へと送り込むことを提案しました。

「現在、宇宙に滞在して340日が経過しています」と、HPEのアメリカHPC技術責任者であり、この実験の共同責任者でもあるマーク・フェルナンデス氏は、水曜日にサンフランシスコで開催されたISS研究開発会議のパネルトークで述べた。

このコンピューターは、宇宙飛行士の日常業務を支援したり、高度なプログラムを実行したりすることはできません。インターネットを閲覧することはもちろんできません。その代わりに、一連のベンチマークテストを実行し、インターコネクト、ストレージ、CPU、メモリの各コンポーネントを限界までテストし、宇宙でコンピューターが壊れるかどうかを検証します。そして、その結果を地球上のコンピューターと比較し、違いがあるかどうかを確認します。

このマシンは放射線耐性が強化されておらず、破損を防ぐためにいくつかのソフトウェアトリックに依存しています。フェルナンデス氏はこれを「自律的なセルフケア」と呼んでいます。継続的なヘルスチェックによりコンピューターの状態が管理され、ハードウェアの潜在的な障害が検出されると、動作速度が遅くなったり、「アイドルモード」に移行して電源がオフになったりします。

「速く動くことは遅く動くよりいい。遅く動くことは電源を切られるよりいい。しかし、電源を切られることは損傷を受けるよりいい」とフェルナンデス氏はThe Register紙に語った。スーパーコンピューターがダウンしたのは2件のみで、どちらも偶発的な事故だった。

HPE

賭けてみよう: 1TFLOPSのHPEボックスは適切な放射線耐性がなければ宇宙でどれくらい持ちこたえられるか

続きを読む

一つは、ISSの煙感知器が誤って作動し、緊急時に電源が遮断された際に発生した。「宇宙ステーションには、埃、歯磨き粉の破片、パンくずなど、あらゆるものが浮遊しています。おそらく、それらの粒子の一つが煙感知器に詰まったのでしょう。原因は不明です」と彼は述べた。

もう1件は、スペースX社のドラゴン宇宙船から物資を降ろす際に、宇宙飛行士がHPE社のコンピューターが入っているラックの電源スイッチを誤ってオフにしたことが原因でした。

「最も一般的な故障は、電源、メモリ、CPUキャッシュといった、一時的な計算関連の故障です。これらは地球上よりも宇宙で頻繁に発生します」とフェルナンデス氏は述べた。「インターコネクト自体は問題ありませんが、SSDは宇宙では驚くほど高い確率で故障します。」

HPEは、将来の宇宙ミッション用に新たなコンピューターを開発する場合、耐放射線性SSDの採用を検討している。「私たち自身もこれほど長持ちするとは思っていなかったので、まだ動いているのは嬉しい驚きです。少なくとも火星までは持ちこたえられるだろうということは分かっていますが、帰還できるかどうかは分かりません」と彼は語った。®

Discover More