Cloud Monitor

プロダクト紹介

Cloud Monitorとは

CloudMonitor は、Alibaba Cloud が提供する、Alibaba Cloud リソースとインターネットアプリケーションをモニタリングするサービスです。

CloudMonitor は、クラウドユーザー向けの、すぐに使用できるエンタープライズクラスのワンストップのモニタリングソリューションです。 IT 施設、外部ネットワークの品質、イベント、カスタムメトリック、サービスログをモニタリングできます。 CloudMonitor は、効率性、包括性、費用対効果に優れたモニタリングサービスです。 クロスサービスおよびクロスリージョンのアプリケーショングループ管理モデルとアラートテンプレートを採用しています。 CloudMonitor を使用することで、数十のクラウドサービスと数万件のインスタンスのモニタリングおよびアラート通知の送信ができる効率的な管理システムを構築できます。 また、サービスのモニタリングダッシュボードを構築し、カスタマイズすることが可能です。 さらに、システムサービスの可用性の向上や、IT システムの運用及び保守点検コストの削減を支援します。

CloudMonitor は、Alibaba Cloud リソースメトリックとカスタムメトリックに関するデータを収集します。 また、サービスの可用性の検出や、特定のメトリックに関するアラートの設定をすることができます。 CloudMonitor は、クラウドサービス、リソース使用率、アラートの概要をリアルタイムで提供します。 この情報をもとに、例外が生じた場合は迅速に対応し、アプリケーションの可用性を確保することができます。

機能

CloudMonitor には、次の機能があります。

  • ダッシュボード :必要に応じてモニタリングデータを表示できます。 ダッシュボードでは、複数のサービスとインスタンスのモニタリングデータを中央地点から閲覧できます。
  • アプリケーショングループ :リージョンとサービスをグループ化してリソース管理をすることができます。 この機能では、サーバー、データベース、SLB (Server Load Balancer) インスタンス、ストレージなどのサービス関連のリソースを管理できます。 アラートルールを管理し、各サービスに関連するモニタリングデータを表示することで運用及び保守点検を効率化できます。
  • ホストモニタリング :サーバーにプラグインをインストールすることで、CPU、メモリ、ディスク、ネットワークを含む 30 以上のメトリックのモニタリングおよびアラート機能を提供します。 インスタンス、アプリケーショングループ、またはリソースに基づいてアラートルールを設定できます。 さまざまなメトリックに基づいて、多様なサービスのルールをカスタマイズすることができます。 現在、Linux と Windows ともにホストモニタリングに対応しています。
  • カスタムモニタリング :ビジネスの要件において重要なカスタムメトリックをモニタリングできます。 収集されたモニタリングデータは CloudMonitor に報告されます。 CloudMonitor はデータを処理し、処理結果に基づいたアラートを生成します。
  • サイトモニタリング:全国のターミナルノードからサイトにユーザーリクエストをシミュレートして送信し、中国のすべてのネットワークオペレーターが提供するネットワーク品質のテストおよびモニタリングを行います。
  • クラウドサービスのモニタリング :購入したクラウドサービスインスタンスのパフォーマンスインジケーターを照会できます。 この情報をもとに、リソースの使用状況の分析、ビジネストレンドに関する統計の収集、システム障害のタイムリーな検出と診断を行うことができます。
  • イベントモニタリング:イベントのレポート、クエリ、アラーム機能を提供します。 イベントモニタリングは、ビジネスにおいて発生する例外事項と重要な変更点を CloudMonitor に報告し、例外発生時はアラートを送信します。
  • アラートサービス :メトリック値が事前に設定されたしきい値を超えるとアラートを送信します。 アラートルールの設定において、アラートシステムがモニタリングデータをチェックする方法とアラートを送信するタイミングを指定できます。 重要なメトリックにアラートルールを設定することにより、メトリックデータの例外が発生した直後に通知を受け取ることができます。 これにより、迅速に例外に対処することができます。

特徴

Cloud Monitor は、ご利用のクラウドサービスに関する分析情報を得るために役立つ強力なデータ分析機能を統合しています。

シームレスな統合

Alibaba Cloud アカウントを有効化するとすぐに Cloud Monitor にアクセスできるため、クラウドプロダクトやサービスの実行ステータスを表示と監視、および使用開始時点からアラームの設定が可能です。

データ可視化

Cloud Monitor では、ダッシュボードを通じて豊富なチャートおよびプレゼンテーション形式を提供します。さらにフルスクリーンプレゼンテーションや自動データ更新もサポートされ、すべての測定の可視化ニーズを満たします。

データ処理のモニタリング

Cloud Monitor は、時間的および空間的次元に基づいたダッシュボードを通して、モニタリングデータを処理することに有用です。

フレキシブルなアラーム

Cloud Monitor では、アラームのルールや通知方法を設定できるアラームサービスが提供されます。このサービスを使用すると、サービスの例外事項を遅延なく識別して修正でき、プロダクトの可用性を高めることができます。

シナリオ

CloudMonitor は、サービスとモニタリングに関する幅広いシナリオに適用できます。

クラウドサービスモニタリング

Alibaba Cloud アカウントを有効化した後、CloudMonitor を使用してクラウドサービスの実行ステータスとメトリックを表示し、メトリックにアラームルールを設定できます。

システムモニタリング

ECS サービスの基本メトリック値 (CPU 使用量、メモリ使用量、帯域幅など) をモニタリングすることで、リソースの過剰使用によるサービスの誤作動を防止し、インスタンスの正常稼働が確保できます。

例外への迅速な対応

Cloud Monitor は、アラームルールに設定されたメトリックしきい値に基づいてアラーム通知を送るため、例外に迅速に対応できます。

迅速なスケールアウト

帯域幅、接続数、ディスク使用量などメトリックのアラームルールを設定した後、クラウドサービスのリアルタイムステータスを簡単に把握し、サービス量の要求に基づいてタイムリーにスケールアウトできます。

サイトモニタリング

Cloud Monitor では 8 つのプロトコル (HTTP (HTTPS)、ICMP、TCP、UDP、DNS、POP3、SMTP、および FTP) をサポートし、サイトの可用性、応答時間、およびパケット損失率を検出するために使用されます。 サイトの可用性についての分析情報を入手し、発生した例外を迅速に解決できます。

カスタムモニタリング

Cloud Monitor ではカスタムメトリックの作成がサポートされ、特定のモニタリング要件をターゲットにすることができます。 これらの新しいメトリックが作成され、対応するデータがアップロードされた後、これらのメトリックに基づく例外はすぐにアラーム通知として報告されます。

用語集

サイトモニタリング

URL および IP の可用性を検出し、HTTP、ICMP、TCP、UDP、DNS、POP3、SMTP、および FTP プロトコル検出ポイントの作成をサポートし、検出されたオブジェクトのステータスコードと応答時間を取得します。

クラウドサービスモニタリング

ECS、RDS、Server Load Balancer、OSS など複数のAlibaba Cloud プロダクトからのデータをモニタリングおよび管理するためのパフォーマンスメトリクスを提供します。

カスタマイズモニタリング

さまざまなビジネスニーズに応じて、カスタマイズ測定を作成し、スクリプトを使用してデータをモニター、管理、およびレポートすることができます。

アラームサービス

Cloud Monitor によって提供されるモニタリングサービスで使用されるさまざまなメトリクスにアラームルールを設定することができます。 指定された 1 つ以上の測定値のモニタリングデータが、設定したアラームルールで指定された条件を満たした場合に、アラームがトリガーされます。

測定値

指定したデータタイプ、またはデフォルトでモニタリングインジケーターとして使用されるデータタイプです。 たとえば、応答時間とステータスコードは、HTTP モニタリングに使用されるデフォルトの測定値です。 ECS インスタンスのモニタリングには、CPU やメモリの使用率など、いくつかの測定値が使用されます。

ディメンション

測定データを見つけるために使用されます。 たとえば、測定ディスク I/O には、インスタンスとディスク名の 2 つのディメンションがあります。 ディメンションは、固有のデータを見つけるためにも使用されます。 現在、カスタマイズモニタリングでは、ディメンションはフィールド情報によって表されます。

アラームルール

特定の期間内の測定データに対して特定のしきい値が満たされたとき、その条件を使用してアラームをトリガーします。 次に、アラームルールの例を示します。インスタンスのメモリ使用率が、5 分間 3 回連続、すなわち 15 分間、50 % になるとアラームが発生します。

ミュート期間

アラームルールで指定された条件が満たされたとしても、指定した期間内にアラームがミュートされトリガーされないように設定できる条件です。 ミュート期間は最大 24 時間まで設定できます。

アラーム連絡先

アラームメッセージの受信者です。

アラーム連絡先グループ

連絡先グループと省略されることもあります。 1つ以上のアラーム連絡先を含むアラーム連絡先のグループです。 アラームルールを設定する場合に、アラーム通知を受信するアラーム連絡先のグループを指定できます。 アラームシステムは、アラームがトリガーされると、アラームルールの設定に基づいてアラームグループの連絡先に自動的にアラーム通知を送信します。

通知方法

SMS メッセージやメールなど、アラーム通知をアラーム連絡先またはアラーム連絡先グループに送信する方法です。

クイックスタート

概要

Cloud Monitor では、クラウドサービスの概要、クラウドリソースの使用状況、アラーム、および重要なイベントを提供します。これにより、リソースの利用状況とメンテナンス、およびクラウドサービスのアラームをリアルタイムで把握できます。

CloudMonitor

クラウドサービスの概要

クラウドサービスの概要には、ご使用のリソースの概要が表示されます。所有されている資産をすばやく簡単に把握することができます。 クラウドサービスの概要には、以下のサービスが表示されます。

  • Cloud Monitor エージェントと共にインストールされる ECS ホストおよび ECS 以外のホスト
  • Server Load Balancer
  • Elastic IP アドレス
  • ApsaraDB for RDS、MongoDB、Memcache、Redis
  • OSS
  • CDN
  • Message Service
  • Container Service
  • Log Service
  • StreamCompute
  • Analytic DB
  • API Gateway
  • E-MapReduce
  • HybridDB for MySQL
  • AnalyticDB for PostgreSQL
  • Express Connect

リソース番号をクリックすることで、クラウドサービスモニタリングで該当するサービスの一覧ページが表示されます。

注:CPU、メモリ、ディスク使用量などの ECS データをモニターおよび表示するには、Cloud Monitor エージェントをインストールする必要があります。 Cloud Monitor エージェントのインストール方法の詳細は、「Cloud Monitor Java エージェントのインストール」をご参照ください。

アラームの概要

アラームの概要には、過去 7 日間のアラームの総数、現在トリガーされているアラームルール数、データが不足しているアラームルール数、および今月のアラーム SMS 使用状況などのアラーム統計が表示されます。

[アラーム数] や [アラームルール] をクリックすることで、詳細情報を表示できます。

イベントの概要

イベントの概要には、24 時間に発生したすべての例外と運用及び保守点検 (O&M) イベントがまとめられています。 サポートされる重要イベントは以下のとおりです。

プロダクト イベント
ホスト エージェントの機能停止
ApsaraDB for RDS マスター/バックアップスイッチオーバー
ApsaraDB for RDS インスタンス障害
ApsaraDB for MongoDB インスタンス障害
ApsaraDB for Redis マスター/バックアップスイッチオーバー
ApsaraDB for Redis インスタンス障害

リソース使用量の概要

リソース使用量には、アカウント配下の各サービスの全体的なリソース使用量が表示されます。OSS、CDN、および Log Service は、当月の累積使用量がモニターおよび測定されます。 その他すべてのサービスのメトリクスは、95 パーセンタイル方式を使用してリアルタイムでモニターされます。 たとえば、ECS インスタンスの CPU 使用量の 95 パーセンタイルが 34 % の場合、ECS インスタンスの 95 % のCPU 使用量は 34 % 未満です。 この方式で定められる値はプロダクトによって異なります。

リソースインジケーターの説明

 
プロダクト インジケーター 統計的方法 統計期間 統計範囲
ホスト CPU 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ホスト メモリ使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ホスト ディスク使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ホスト アウトバウンドインターネット帯域幅 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for RDS CPU 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for RDS IOPS 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for RDS 接続使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for RDS ディスク使用量 95 パーセンタイル リアルタイム すべてのインスタンス
OSS 当月のアウトバウンドインターネットトラフィック合計 合計 当月の初日の 00:00 から現在の時刻までの累積値 すべてのバケット
OSS 当月の PUT リクエスト総数 合計 当月の初日の 00:00 から現在の時刻までの累積値 すべてのバケット
OSS 当月の GET リクエスト総数 合計 当月の初日の 00:00 から現在の時刻までの累積値 すべてのバケット
OSS ストレージサイズ 合計 現在、すべての OSS バケットによって占有されているストレージの合計 すべてのバケット
CDN 当月のトラフィック総数 合計 当月の初日の 00:00 から現在の時刻までの累積値 すべてのドメイン名
CDN ピークネットワーク帯域幅 95 パーセンタイル リアルタイム すべてのドメイン名
CDN Access QPS 95 パーセンタイル リアルタイム すべてのドメイン名
ApsaraDB for MongoDB CPU 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for MongoDB メモリ使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for MongoDB IOPS 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for MongoDB 接続使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for MongoDB ディスク使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for Memcache キャッシュヒット率 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for Memcache キャッシュ使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for Redis メモリ使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for Redis IOPS 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for Redis 接続使用量 95 パーセンタイル リアルタイム すべてのインスタンス
EIP インバウンドネットワーク帯域幅 95 パーセンタイル リアルタイム すべてのインスタンス
EIP アウトバウンドネットワーク帯域幅 95 パーセンタイル リアルタイム すべてのインスタンス
Container Service CPU 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
Container Service メモリ使用量 95 パーセンタイル リアルタイム すべてのインスタンス
Container Service アウトバウンドインターネットトラフィック 95 パーセンタイル リアルタイム すべてのインスタンス
Log Service 当月のインバウンドネットワークトラフィック合計 合計 当月の初日の 00:00 から現在の時刻までの累積値 すべてのプロジェクト
Log Service 当月のアウトバウンドネットワークトラフィック合計 合計 当月の初日の 00:00 から現在の時刻までの累積値 すべてのプロジェクト
Log Service 当月のリクエスト合計 合計 当月の初日の 00:00 から現在の時刻までの累積値 すべてのプロジェクト
ApsaraDB for HybridDB CPU 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for HybridDB メモリ使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for HybridDB IOPS 使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for HybridDB 接続使用量 95 パーセンタイル リアルタイム すべてのインスタンス
ApsaraDB for HybridDB ディスク使用量 95 パーセンタイル リアルタイム すべてのインスタンス