Alertmanagerクライアント - Prometheusドキュメント

このページはPrometheus公式ドキュメント和訳+αの一部です。

SENDING ALERTS

免責事項: Prometheusは、アラーティングルールで生成されたアラートを自動的に送信する。 直接クライアントを実装するのではなく、時系列データに基づいたアラーティングルールをPrometheusに設定することを強くお勧めする。

Alertmanagerは、エンドポイント/api/v1/alertsでアラートをリッスンしている。 クライアントは、アラートがactiveである限りアラートを再送信し続ける(普通は大体30秒から3分)と想定されている。 クライアントは、このエンドポイントに以下の形式のPOSTリクエストでアラートのリストをpushすることができる。

[
  {
    "labels": {
      "alertname": "<requiredAlertName>",
      "<labelname>": "<labelvalue>",
      ...
    },
    "annotations": {
      "<labelname>": "<labelvalue>",
    },
    "startsAt": "<rfc3339>",
    "endsAt": "<rfc3339>",
    "generatorURL": "<generator_url>"
  },
  ...
]

ラベルは、同一のアラートを特定し、重複削除を行うために利用される。 アノテーションは、アラートを特定することはなく、常に一番新しく受信した値にセットされる。

タイムスタンプはどちらも必須ではない。 startsAtが省略されると、Alertmanagerによって現在時刻が割り振られる。 endsAtはアラートの終了時刻がわかっている場合のみセットされる。そうでなければ、アラートが最後に受信された時間からのタイムアウト期間に設定される。

The generatorURL field is a unique back-link which identifies the causing entity of this alert in the client.

参考リンク

おすすめ書籍

入門 Prometheus ―インフラとアプリケーションのパフォーマンスモニタリング

入門 Prometheus ―インフラとアプリケーションのパフォーマンスモニタリング

 
入門 監視 ―モダンなモニタリングのためのデザインパターン

入門 監視 ―モダンなモニタリングのためのデザインパターン

 
SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム