网站系统及服务层面的测量数据

这是在运维工程师笔记本电脑上以图形方法显示的数据,这些数据是由对象采集并显示的,这些对象有Cacti、Ganglia、HypericHQ、Zenoss、Munin,或其他你总能碰着的什么对象。采集这些体系资本数据绝对须要很高的分辩率,能力描绘体系容量、及时进行毛病排查、跨越分歧集群对数据进行联系关系。

多半对象采集所有基本数据:CPU、收集、磁盘(空间应用率和I/O应用率)、内存,等等。这些数据应被视为深入懂得基本架构运行的基本。我以为,关于办事器,假如你所知道的就只是这些测量数据的话,可以以为你就是个瞎子。一个多小小日时的时光里体系CPU的应用率到达12%,而运用法式的行动到底是怎么样的,这个数字并不克不及告知你若干器械一一而运用法式的行动才是要点。体系资本是若何现实应用的,运用和办事层面的测量数据会给出相干的信息。

假如不克不及用同样的对象来采集这些数据的话,也要尽量用邻近的对象,这会有很年夜的利益。有了这些数据,就可以答复下面的问题:

● 平均的Web要求的CPU时光(用户态和体系态)是若干?

● 和纯洁运用法式的履行时光比拟起来,用于数据库查询的最慢的API挪用消费时光的百分比是若干?

● 对文件体系缓存(而非法式内部的缓存)的依附有多年夜?响应时光随要求率的升沉变更,能解释有共享资本吗?

● 用于Web页面、AJAX、RSS、API办法的前端要求各占若干百分比?以文件年夜小来计,最年夜的页面响应是若干?

● 响应时光随响应年夜小按比例变更吗?

● 最慢的数据库查询是什么?挪用频度是若干?

● 用得最多的数据库查询是什么?挪用频度是若干?

答复这些问题,能赞助你找出哪些网站扶植优化值得做、排盘问题时从哪里入手、什么样的资本应用对你而言是“正常”的,从而可以在监控体系上设置适合的报警阈值。

相關文章: