如何衡量网站监控:什么有价值,什么无价值?

我们指出了对公司来说并非所稀有据都是有价值的,但所稀有据都是有成本的。这句话同样实用于监控。假如你要对本身能想到的所有器械都进行监控,那么很可能在你收集的数据中,你能用到的少之又少。同时,你还制作了许多噪声,这就是年夜多半监控平台掉去感化的预兆。此外,你还糟蹋了年夜量的员工时光和公司资本,从而消费了股东的钱。要赞助你懂得哪些监控指标对我们来说有价值,而哪些没有,最简略的方法是自上而下地慢慢履行一遍我们的渐进式监控框架,解释每层发明的价值以及若何限制这些实现的成本。

我们的第一个问题是“有问题吗”。如前所述,这种监控指标并不多,年夜约三到七种,它们既能供给猜测性的指标,又能供给当前的指标,用于解释即将有问题或如今已经有问题了。因为我们要跟踪的项目数目较少,所以数据保存应当不是个年夜问题。最好能每分钟或每小时绘制一次这种数据,并至少与前两周中类似时光内的数据进行比较。假如今天是周二,那么我们可能须要前两个周二的有价值的数据。也许我们只需保存前两周的数据即可,但在我们汇总数据之前,也可以把规模扩大到保存一个月的数据。从久远来看,这些数据不会占用年夜量空间。此外,在猜测与肯定是否要产生问题或已经产生了问题方面,这些数据会给我们节俭许多时光。

接下来我们要问的问题是“哪里有问题”。我们的金字塔注解,尽管问题的具体水平在缩小,但数据量却在增加。这应当弓起我们的留意,因为我们要实现这一点,就须要更多的监控指标。这种监控指标的数目可能在10到100之间,远远多于我们原始的监控指标。在异常年夜型的庞杂的散布式体系中,监控指标的数目可能更多。我们仍然须要与以前类似日期中的数据进行比拟,幻想状态是分层比较。但在我们的汇总和归档/删除策略中,我们须要激进得多。幻想的做法是,我们起首依照小时汇总数据,然后把数据纳人均线的盘算。也许我们会绘制和保存图形,而跟着时光逐渐删除原始数据。我们当然不想无穷制地保留原始数据,因为它们中的年夜多半再被用到的可能性很低,因而价值很低,成本却很高。

最后,我们要问的是“什么问题”。我们所需的网站扶植监控指标数比上一个监控计划又至少进步了一个数目级。我们会加上原始输出日记、毛病日记以及其他数据。这类数据增长得很快,尤其是在一个对话多的情况中。我们可能愿望保存两周的数据,这里假设了从两周的数据中能抓住年夜部门问题。也许对于保存什么和删除什么你有更好的信息,但我们要强调的是,你不克不及请求随时随地都可以检讨任何指标,这会有损股东价值,因为这种请求几乎须要无限多的消费,而获得的回报却异常异常低。

相關文章: