Google Borgmon

监控是生产环境必需的一部分,是稳定服务的基础。Borg出现于2003年,是Google的调度服务;而Borgmon是Google的监控服务,是对Borg的补充。 监控的挑战和需求: Google体量下,要分析大量系统组件 需要合理的维护成本 既要对单个组件,也要对整体区域等多个维度的测量、分析和报警 在过去的十年里,Google的监控系统从自定义的脚本进化到了Borgmon,提供了新的基于时间序列(time-series)的监控系统。 应用与接口 Google使用varz方法展示内部状态, »