ジョブとインスタンス - Prometheusドキュメント

このページはPrometheus公式ドキュメント和訳+αの一部です。

JOBS AND INSTANCES

Prometheus用語で、スクレイプすることができるエンドポイントはインスタンスと呼ばれ、通常は1つのプロセスに対応している。 同じ目的のインスタンス(例えば、スケーラビリティや信頼性のために複製されたプロセス)の集合はジョブと呼ばれる。

例えば、4つの複製されたインスタンスから成るAPIサーバーのジョブは、以下のように構成される。

  • job: api-server
    • instance 1: 1.2.3.4:5670
    • instance 2: 1.2.3.4:5671
    • instance 3: 5.6.7.8:5670
    • instance 4: 5.6.7.8:5671

自動生成されるラベルと時系列

Prometheusが監視対象をスクレイプするとき、監視対象を識別できるように、以下のラベルを時系列に自動的に付与する。

  • job: その監視対象が含まれるジョブの名前
  • instance: スクレイプされたURLの<host>:<port>の部分

スクレイプしたデータにこれらのいずれかのラベルが既にあった場合の挙動は、honor_labelsの設定値によって異なる。 詳細は、スクレイプの設定のドキュメントを参照すること。

それぞれのインスタンスのスクレイプで、Prometheusは以下の時系列に値を保存する。

  • up{job="<job-name>", instance="<instance-id>"}: スクレイプが成功したら1、失敗したら0
  • scrape_duration_seconds{job="<job-name>", instance="<instance-id>"}: スクレイプの時間
  • scrape_samples_post_metric_relabeling{job="<job-name>", instance="<instance-id>"}: メトリックのリラベルが適用された後で残っている値の数
  • scrape_samples_scraped{job="<job-name>", instance="<instance-id>"}: 監視対象が出力した値の数

時系列upは、インスタンスの可用性を監視するのに利用できる。

参考リンク

おすすめ書籍

入門 Prometheus ―インフラとアプリケーションのパフォーマンスモニタリング

入門 Prometheus ―インフラとアプリケーションのパフォーマンスモニタリング

 
Prometheus: Up & Running: Infrastructure and Application Performance Monitoring

Prometheus: Up & Running: Infrastructure and Application Performance Monitoring

 
入門 監視 ―モダンなモニタリングのためのデザインパターン

入門 監視 ―モダンなモニタリングのためのデザインパターン

 
SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム