このページはPrometheus公式ドキュメント和訳+αの一部です。
Robust Perception | Prometheus Monitoring Experts
- 記事へのリンク
- 記事の結論、格言的なもの(読んだもののみ記載)
- Cardinality is key
- Putting queues in front of Prometheus for reliability
- How should pipelines be monitored?
- パイプライン全体の処理時間でアラートするのはよい、長い時間かかるパイプラインはキューの増加(例えば
deriv(my_queue_size[30m]))でアラートするのが良い、キューに溜まっている数だけでアラートするのはよくない
- パイプライン全体の処理時間でアラートするのはよい、長い時間かかるパイプラインはキューの増加(例えば
- Idempotent Cron Jobs are Operable Cron Jobs
- Be discerning in what dashboards you share with users
- Avoid the Wall of Graphs
- How many metrics should an application return?
- What is a job label for?
- jobラベルは、同じことをするアプリケーションを整理するために使う
- Why predeclare metrics?
- Will using Prometheus instrumentation clients lock me in?
- When to Alert with Prometheus
- Why not send graphs with alerts?
- Dude, where’s my exporter?
- Common pitfalls when using the Pushgateway
- Keep It Simple scrape_interval-id
- Are increasing timestamps Counters or Gauges?
- Running into burning buildings because the fire alarm stopped
- Percentages go from 0 to 100, Ratios go from 0 to 1
- It’s easy to convert Pull to Push
- Functions to Avoid
- Avoid irate() in alerts
- Existential issues with metrics
- When should you unit test instrumentation?
- What’s in a __name__?
- Push needs Service Discovery
- Label Lookups and the Child
- Federation, what is it good for?
- Prometheusを階層構造にしてメトリクスを集約するのはよい、階層構造の兄弟関係のPrometheusから少しメトリクスを取得するのも良い、他のPrometheusからたくさんのメトリクスを取得するのはよくない
- What’s “up” Doc?
- Who wants seconds?
- Undoing the benefits of labels
- On the naming of things
- One agent to rule them all
- Target labels are for life, not just for Christmas
- ターゲットラベルは、監視対象の生存期間中に変えてはいけないし、出来る限り少なく保つべきである
- Monitoring without Consensus
- クラスタリングはPrometheusには最適ではない。同じ設定のPrometheusを2つ動かすのが良い
- Rate then sum, never sum then rate
- カウンターに直接適用して意味がある演算は
rate、irate、increase、resetsだけ
- カウンターに直接適用して意味がある演算は
- Little Things Matter
- Consulのタグを使う時のパターンは
regex: .*,tagB,.*である(ようにPrometheusを設計した)
- Consulのタグを使う時のパターンは
参考リンク
おすすめ書籍

入門 Prometheus ―インフラとアプリケーションのパフォーマンスモニタリング
- 作者: Brian Brazil,須田一輝,長尾高弘
- 出版社/メーカー: オライリージャパン
- 発売日: 2019/05/18
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る

- 作者: Mike Julian,松浦隼人
- 出版社/メーカー: オライリージャパン
- 発売日: 2019/01/17
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る

SRE サイトリライアビリティエンジニアリング ―Googleの信頼性を支えるエンジニアリングチーム
- 作者: 澤田武男,関根達夫,細川一茂,矢吹大輔,Betsy Beyer,Chris Jones,Jennifer Petoff,Niall Richard Murphy,Sky株式会社玉川竜司
- 出版社/メーカー: オライリージャパン
- 発売日: 2017/08/12
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
和訳活動の支援
Prometheusドキュメント和訳が役に立った方は、以下QRコードからPayPayで活動を支援して頂けるとありがたいです。
