ダッシュボードのプッシャー: コンテナ化されたサーバーの世界は暗いですね、システム管理者の皆さん?

Table of Contents

ダッシュボードのプッシャー: コンテナ化されたサーバーの世界は暗いですね、システム管理者の皆さん?

分析私は一体どこへ向かっているのでしょうか? コンテナ化された環境でシステム管理者を務めるのは、ライトも計器もない霧の中で車を運転しているようなものです。

Coralogixは、システム管理者にとってのフォグランプやダッシュボードの計器のような存在として位置づけられています。同社の機械学習ソフトウェアは、コンテナ化されたランタイム環境で記録されたイベントを分析し、パターンを検出・相関させることで、システム管理者がシステムの障害を診断・修正するのを支援します。これまで混乱していた部分に、明確さと詳細さをもたらします。

すごく派手ですね。実際どういう意味ですか?

車のダッシュボード計器のアナロジー

サーバー上で稼働中のコンテナ化されたアプリケーション群を自動車に例えてみましょう。自動車とコンテナ化されたサーバーシステムの両方において、内部では絶えず変化する膨大なオペレーションが稼働しています。レジストリから様々なコンテナがインスタンス化され、Dockerエンジンなどの監視コンテナOSの下で実行され、他のマイクロサービスを呼び出し、IOリクエストを送信し、そして破棄されます。このように、絶えず変化するコンテナ群が、動作中のアプリケーションを表現しているのです。

車の中では、一連の部品が作動します。燃料と空気がシリンダーに送り込まれ、ピストンが上下し、クランクシャフトが回転し、点火プラグが点火し、ギアが切り替わり、タイヤが回転し、排気ガスが排出され、ブレーキが作動するなど、様々な動作が行われます。車にはドライバーが乗っており、ドライバーはダッシュボードに表示されるエンジン回転数、車速、油圧、選択されているギア、その他の状態やイベントの指示に従って運転します。

多くの計器は、ドライブシャフトの回転数を車の速度に変換するスピードメーターのように、生の入力から出力を計算します。

何か問題が発生した場合、ダッシュボードがエラーの検出と診断に役立ちます。

コンテナ化されたアプリケーション セットには通常、管理者用のダッシュボードはなく、また、特別に設計されていない限り、そのようなダッシュボードが存在する場合でも、それを駆動するためのカスタマイズされた生データ フィードはありません。

つまり、エラーや障害が発生した場合、管理者は状況を把握できないまま作業を進める可能性があります。イベントログは存在しますが、これらは通常、コンテナ開発者がコーディングやデバッグの補助として進捗状況や状態を示すために作成するものです。ログに記録されたイベントが発生した状況、つまりコンテキストを知らなければ、全く意味がありません。これは、エンジンの6番シリンダーの3番バルブが特定の時間に開いたという情報を知っているのと同じです。イベントが孤立してコンテキストから切り離された状態では、そのイベントに関する情報は無意味です。

コンテナ化されたアプリ内のコンテナの操作にコンテキストを追加するにはどうすればよいでしょうか?

Coralogix さん、前進してください。

ガイ・クルップ

Coralogixの共同創設者兼CEOであるGuy Kroupp氏

コラログフィックス

Coralogixは、数百万件ものログファイルレコードを解析するためのソフトウェアを開発しているイスラエルのスタートアップ企業です。基本的に、ログを記録し、それをカテゴリに分類します。

Coralogix イベント分類

Coralogixイベント分類

ログに記録されたイベントは、「ユーザー X がカテゴリ Z から Y を注文した」などのアーキタイプの例として認識され、識別されて文字 (この場合は「A」) が付与されます。

これは、イベント検索の対象数が 1 桁以上削減されたことを意味します。Coralogix では、数十億の生のイベントがはるかに少ない数のカテゴリになるため、これをログ集約 (略して log-gregation) と呼んでいます。

サーバーからの生のログ到着をリアルタイムで確認し、いわば猛烈な突風を観測してから、ログ集約ビューに切り替えてテンプレート レベルのアクティビティのみを表示できます。

上の画像は、識別された5つのカテゴリを示しています。ソフトウェアは、これらのアルファベット識別子の発生を追跡し、繰り返し出現する識別子をグループ化することができます。

上の画像では、「ABC」がイベントトライアドであることが確認されており、これは支払い取引を表しています。これはテンプレートと呼ぶことができます。これにより、ソフトウェアはログストリーム内のテンプレートの出現を追跡し、アイテム数をさらに削減できるようになります。

次に、入力されたイベントストリームを分析し、これらのテンプレートがいつどこで発生したかを確認します。これは、遺伝子内のDNA配列を探すようなものです。

Coralogix_テンプレート_DNA_チェック

Coralogix テンプレート追跡

これが完了すると、イベント ストリーム監視は、そのようなテンプレートの頻度とタイミングを検出し、通常の頻度とタイミング パターンのアプリケーションのプロファイルを構築できるようになります。

そして、これが肝心な点ですが、アプリケーションの動作が変わった場合、Coralogix のソフトウェアはそれを検出し、システム管理者に警告できると主張しています。

Coralogix_Template_異常な発生

テンプレートの出現頻度の標準からの逸脱

ソフトウェアはどの生のイベントがテンプレートを生成したかを「知っている」ため、特定のコンテナから特定のイベント タイプをドリルダウンして、疑わしいエラーの提案とともに障害診断を支援できると開発者は主張しています。

Coralogix_疑わしいエラー

Coralogix のエラー表示の提案

Coralogixは、イスラエルのプレスツアーで多くのジャーナリストに同社のソフトウェアのこの機能を紹介しました。デモを見る機会があり、もちろんデモではすべてが概ね正常に動作しました。

Coralogixの背景

同社は2014年に、CEOのガイ・クループ氏、最高製品責任者のアリエル・アサラフ氏、最高科学責任者のリオル・レドゥス氏によって設立されました。創業者(アサラフ氏)はイスラエル軍諜報部隊8200(シギントとクリプト)での経験があり、またVerintでも経験を積んでいます。

同社によると従業員は12名(うち5名は米国在住)、世界中に400社の顧客を抱えており、決して軽視できる規模ではない。2回の資金調達ラウンドで350万ドルを調達したが、これは多くのスタートアップ企業からすれば取るに足らない金額だ。

Assaraf 氏は次のように語っています。「私たちは、運用 IT、テスト、開発を中心とした製品を構築しました。視覚化とクエリのために、生のデータを Elastic Search に保存しています。」

クループ氏はさらにこう付け加えた。「私たちはアラートをほとんど出さないので、誤検知率は非常に低いのです。」これは良い情報だ。

このソフトウェアはサービスとして提供され、AWSとAzureで利用できます。ビジネスモデルは、顧客がCoralogixに送信するデータの量に応じて料金が決定されます。

詳細はこちらでご確認いただけます。30 日間の無料トライアルはこちらからお申し込みいただけます。

競合企業としては、The Registerで言及されているLogz.ioや、Coralogixが設立される前の2013年にCiscoから資金提供を受けたLogglyなどがある。

ネット:ネット

コンテナ化されたシステムのシステム管理者が、現在、障害修正の際に暗闇の中で作業している場合、Coralogixのソフトウェアがその問題を解決します。このソフトウェアは、これまで計測機能を備えていなかったシステムに遡及的に計測機能を追加し、コンテナ化された車両をより適切に運転するためのダッシュボードをシステム管理者に提供します。®

Discover More