クラウドストライク2026年版グローバル脅威レポートエグゼクティブサマリー:AI時代に必読の脅威インテリジェンスレポート
ダウンロード

今日のビジネスにおける最も強力な推進力の1つは、デジタルトランスフォーメーションです。これにより従来のアナログビジネスモデルがデジタル形式に移行しました。レコード盤や、ペンと紙でフォームに記入していたことを思い出してください。これらの古い概念はデジタル化されました。また、今日のデジタルビジネスでは、組織は、クラウドインフラストラクチャで実行される一連の分散サービス、マイクロサービス、コンテナで構成されるアプリケーションを使用しています。

これらのシステムと組織のクラウドインフラストラクチャがどのように機能しているかを理解することは、企業の成功に不可欠です。そこで、オブザーバビリティが登場します。ITおよびクラウドコンピューティングにおけるオブザーバビリティとは、リアルタイムデータを収集、集約、関連付けして、環境で何が起こっているかを分析し、全体的なサービス成果を向上させるための一連のプロセスと関連ツールを指します。

オブザーバビリティを使用することで、企業はパフォーマンス、最適化、およびコスト効率を大規模に確保できます。クラウド環境では、DevOpsチームはオブザーバビリティを使用してアプリケーションをデバッグし、システム問題の根本原因を診断します。

オブザーバビリティの3つの柱とは

オブザーバビリティの3つの柱は、ログ、メトリック、トレースです。これら3つのデータ出力は、クラウド環境とマイクロサービス環境のシステムの正常性と機能に関するさまざまなインサイトを提供します。

  1. ログは、システムイベントとエラーのアーカイブレコードまたは履歴レコードであり、プレーンテキスト、バイナリ、またはメタデータで構造化されたレコードです。
  2. メトリックは、CPU使用率、対応時間、エラー率など、システムのパフォーマンスと振る舞いの数値測定値です。
  3. トレースは、システム内を流れる個々のリクエストまたはトランザクションを表したもので、問題のボトルネック、依存関係、および根本原因を特定するのに役立ちます。

ログ、メトリック、トレースを組み合わせて分析すると、システムの全体像を把握し、ビジネス目標を妨げる問題を診断するのに役立ちます。

1. ログ

アプリケーションとシステムで発生するすべてのアクティビティにより、タイムスタンプ、イベントの種類、マシンIDまたはユーザーIDなどの詳細を含むイベントログが生成されます。プレーンテキストまたはバイナリで記述されているか、構造化または非構造化のいずれであるかに関係なく、ログデータには、デバッグおよびシステムイベントやエラーに関するインサイトを得るのに役立つ粒度レベルのテキストとメタデータが含まれています。ログの生成は簡単です。ほとんどの言語は元々イベントログに対応しているため、いくつかの変更を加えるだけで、オブザーバビリティシステムにイベントログを追加できます。

同時に、ログを作成すると、不要なシステムオーバーヘッドが追加され、パフォーマンスの問題につながる可能性があります。ログを使用すると詳細を掘り下げることができますが、問題が1つのイベントや1つのコンポーネントによって発生することはめったにありません。そのため、イベントログをオブザーバビリティの他の柱と組み合わせることは、「全体像」を把握し、コンテキストに応じたインサイトを得るのに非常に役立ちます。

2. メトリック

メトリックは、経時的なパフォーマンスの分析に役立つ定量的な値であり、システムとパフォーマンスに関する必要なインサイトを提供します。多くの場合、オブザーバビリティメトリックは次の目的で使用されます。

  • 主なパフォーマンス指標 (KPI)
  • CPU容量のインサイト
  • メモリのモニタリング
  • システムの正常性と振る舞い

メトリックは、さまざまな方法でサンプリング、要約、関連付け、集計することができ、パフォーマンスとシステムの正常性に関する情報を明らかにします。例えば、組織はリアルタイムのメトリックと履歴データをモニタリングして、一定時間のパターンと傾向を特定できます。これにより、組織は「通常の」パフォーマンスのベースラインを確立し、将来のパフォーマンスの目標を設定できます。

メトリックは、インフラストラクチャコンポーネント間で容易に関連付けて、システムの正常性とパフォーマンスの包括的なビューを提供できるため、時間を節約できます。また、検索が容易になり、データ保持期間が延長されます。

3. トレース

ログとメトリックは、個々のシステムの振る舞いとパフォーマンスを理解するのに役立ちますが、分散システムでのリクエストの有効期間を把握するのに役立つ情報を提供することはほとんどありません。そこで登場するのがトレースです。トレースは、リクエストがシステムを通過する際の複雑な経路を可視化します。特に、コンテナ化されたアプリケーションサーバーレスアーキテクチャマイクロサービスアーキテクチャなどのシステムをプロファイリングし、観察するのに適しています。

例えばトレースは、特定のリクエストが終了(またはクラッシュ)する前にどのメソッドやサービスをたどっていたかを示すことができます。トレースは、システムの正常性を理解し、改善する上で重要な役割を果たします。トレースデータを分析することで、全体的なパフォーマンス、対応時間、エラー率、スループットに関する貴重なインサイトを得るだけでなく、ボトルネックやその他の問題を引き起こしている可能性のある領域を特定できます。この情報により、ユーザーやカスタマーエクスペリエンスに影響が及ぶ前に、潜在的な問題にプロアクティブに対処することができます。

トレースを使用する際の主な考慮事項の1つは、トレースシステムによって生成されるデータの量が非常に多いことです。大規模なアプリケーションでは、トレースの数がすぐに膨大になり、分析して意味のあるインサイトを抽出することが困難になります。そのため、トレースはすべてのリクエストに対して保存されるわけではなく、サンプリングされる傾向にあります。

詳細

この記事では、サービスとしてのロギングソリューションが何を達成するのに役立つか、また、導入する際に何を考慮する必要があるかについて説明しています。

サービスとしてのロギング (LaaS)

ツールとテクノロジー

オブザーバビリティツールを選択する際には、組織のニーズに最も適したツールを選択できるように、多くのオプションを理解することが重要です。次に、最も一般的なタイプのオブザーバビリティツールを示します。

個々の「ポイント」ソリューション

ログ管理ツール

ログ管理ツールは、ログデータの収集と保存に役立ちます。一部のソリューションではユーザーはログをリアルタイムで検査し、異常のアラートを作成できます。ログ管理ツールは、情報を迅速かつ効率的に収集および保存できるため、ログコンプライアンス要件を遵守するための効果的な方法を必要とする組織に役立ちます。

アプリケーションパフォーマンスモニタリング (APM) ツール

APMツールは、ソフトウェアアプリケーションをモニタリングし、エンドユーザー、システム、ネットワークインフラストラクチャのトランザクション速度を追跡して、操作性に悪影響を与える可能性のあるパフォーマンスの問題やボトルネックを特定します。これらのテクノロジーは、本番環境アプリケーションのパフォーマンスを測定するため、ユーザーは問題を発見し、その根本原因を特定できます。APMツールは、ビジネス上重要なアプリケーションのパフォーマンスメトリックを取得することに焦点を絞ったオブザーバビリティ要件を持つ組織に役立ちます。

包括的なソリューション

オブザーバビリティプラットフォーム

個々のツールとは異なり、オブザーバビリティプラットフォームは、組織にインサイトとシステムからの継続的なフィードバックを提供します。モニタリング、ロギング、トレースの3つの機能をすべて備えた1つのオブザーバビリティプラットフォームにより、インフラストラクチャ全体から組織のシステムとサービスの状態を包括的に把握することができます。企業の一元化されたテレメトリデータを分析するオブザーバビリティプラットフォームを使用すると、データの価値が高まり、チームがユースケース全体でビジネス上の重大な意思決定を行うための有意義なコンテキストが提供されます。

オブザーバビリティを実装するためのベストプラクティス

オブザーバビリティとそれがもたらす価値を理解した上で、次のリストを使用して、組織に最適なソリューションを実装できます。つまり、オブザーバビリティプラットフォームは次のことができる必要があります。

  • 使用しているシステム全体と各アプリケーションスタックで、ネイティブまたは信頼性の高いプラグインを介して統合する
  • 自動化された再現可能な方法でのインストール
  • すべてのターゲットコンポーネントからリアルタイムデータをキャプチャし、有意義で費用対効果の高い方法で保存、インデックス化、関連付け
  • 複雑なシステムの全体像をリアルタイムで提供
  • トレーサビリティをサポートし、どこで問題が発生しているかを正確に示し、重要な情報をノイズから分離することでこれを実現する
  • 時系列での傾向と異常レポートの提供
  • 関連するすべてのコンテキストデータをアラートとレポートに表示
  • ユーザーフレンドリーなインターフェースを提供し、さまざまなチーム用にカスタマイズされた集計レポートの作成をサポート

Expert Tip

この記事では、堅牢でスケーラブルなログ記録インフラストラクチャの基礎を築くことができるログ記録のベストプラクティスについて説明しています。

ログ記録のヒント

次世代SIEMおよびログ管理のための世界をリードするAIネイティブプラットフォームをお試しください

SIEMログ管理のための最高水準のAIネイティブプラットフォーム、CrowdStrike Falcon®プラットフォームでサイバーセキュリティを強化しましょう。ペタバイト規模でのセキュリティログを体験してみてください。クラウドネイティブ型または自己ホスト型での展開が可能です。ボトルネックの生じない、強力でインデックスフリーのアーキテクチャを利用してデータをロギングすれば、1日あたり1PB以上のデータを取り込んで脅威ハンティングに役立てることができます。リアルタイムの検索機能により攻撃者をしのぐスピードで対策を実施できます。複雑なクエリを実行しても、そのレイテンシーは1秒未満です。360度の可視性によりデータを統合してサイロ化を解消し、セキュリティ、IT、DevOpsチームがシームレスに脅威のハンティング、パフォーマンスのモニタリング、コンプライアンスの確保を行うことができます。30億件ものイベントにわたる作業でも1秒未満で実施できます。

アーファン・シャリフは、クラウドストライクのオブザーバビリティポートフォリオの製品マーケティングリードです。Splunk、Genesys、Quest Softwareなどの企業向けに、15年以上にわたってログ管理、ITOps、オブザーバビリティ、セキュリティ、CXソリューションなどを推進してきた経験を有しています。アーファンは、バックスアンドチルターンズ大学でコンピューターサイエンスを修了しており、製品マーケティングとセールスエンジニアリングにまたがるキャリアを持っています。