横向扩展数据中心
设计具有三个或更多及时数据中间的体系,以削减整体成本进步可用性以及实现灾害恢复。实用于任何斟酌参加一个灾害恢复(冷备份)数据中间的超高速成长的公司。采取“多个及时数据中间”的设置装备摆设,拆分你的数据,疏散到这些数据中间,把事务负载也疏散到这些数据中间。应用过剩的容量来应对每年的岑岭期。
对你的营业来说,数据中间涌现故障是灾害性的袭击。平日设计为三个或更多个数据中间,因为如许成本比只有两个数据中间低。在岑岭期应用闲置的容量,而不是下降处置事务的速度。
要点:在实行灾害恢复时,应用三个或更多个及时数据中间的设计,可以下降灾害恢复的成本。在需要时,可以应用闲置容量知足岑岭期的需求。
对于超高速成长的公司来说,数据中间的扩大已经成了最年夜的痛点之一。这是因为,筹划和建造数据中间的时光较长,并且它也是在高速成长阶段我们最不肯意斟酌的工作之一。但有时,最不肯意斟酌的工作是对公司伤害最年夜的工作。这个原则简略地介绍了“若何”以及“为什么要挤分数据中间以应对高速的成长。
起首,让我们看一些基本。为了实现故障隔离(有助于带来高可用性)和事务的增加,我们想分离用原则8和原则9介绍的Y轴和Z轴扩大办法对数据进行分片。为了实现高可用性和事务的增加,我们想用原则7介绍的X轴扩大办法复制(或克隆)数据和办事。最后,我们假设0,你可能有一个无状况体系或者可以或许依据本身的有状况需求进行设计,从而应用多个数据中间。恰是数据和办事以及无状况体系的分片、复制、克隆形成了分区,从而使得我们可以或许把数据中间散布到多个分歧所在的站点中去。
假如我们沿z轴切分数据(参阅原则9),那么可以把数据放在离要求该数据的用户较近的数据中间。假如要在切分数据时保持多租户性,可以选择离终端用户近的数据中间。假如“原子”或“粒度”元素是一个公司,那么可以把数据中间放在所办事的公司邻近(假如是家年夜型公司,至少要选择距离该公司最年夜的办公区较近的地位)。
起首,让我们从三个数据中间入手,这时每个数据中间寄存约33%的数据。我们将这三个数据集称之为为A数据集、B数据集和C数据集。每个数据中间的数据集都进行了备份并等分为两部门,而这两部门的副本则分离存在其他两个数据中间。假设采取Z轴拆分和X轴复制的办法复制数据,那么A数据中间的客户的50%的数据将寄存在B数据中间,其别的50%的数据寄存在C数据中间。任何一个数据中间涌现故障,那么该数据中间50%的数据和相干事务都邑被转移到其他两个数据中间。假如A数据中间涌现故障,那么它509%的数据和相干事务会被转移到B数据中间,别的50%将被转移到C数据中间。如图3-2所示。成果是所有站点总计存储了20096的数据,然则每个站点只保留数据总量的66%,因为每个站点寄存了100%的主数据集副本(占该站点数据总量的3%)和其他两个站点的50%的数据副本(总量占该站点数据量的33%,每个数据副本占数据量的165%)。
要懂得这种设置装备摆设为什么比两个数据中间好,须要进行一些盘算。假设你至少须要两个数据中间,使营业可以或许在地舆地位上孤立的灾害事宜中存活。假如我们有两个数据中间,分离标志为A和B,那么你可能会用A数据中间进行1009%的操作,让B数据中间作为热备份。采取热冷(或积极被动)设置装备摆设,那么两个数据中间都要具备10096的盘算及收集资本,这包含10096的Web和运用办事器、10096的数据库办事器和10096的收集装备。两个数据中间的电力需求类似,收集衔接类似。为了应对岑岭期激增的需求,每个数据中间可能须要稍年夜于100%的容量才行。假设每个数据中间须要110%的容量。无论何时为一个数据中间增长办事器,都要为另一个数据中间购置等量的办事器。也许为了平安复制数据,你可能会采取专用线路衔接两个数据中间。同时运行两个及时数据中间,那么在产生灾害时,在把所有处置转移到备用数据中间之前,只有50%6的事务会掉败,但这种办法在预算和财政方面却没有什么优势。
然则,采取三个及时数据中间,成本就会降低。这是因为,在每个站点中,对于所有的非数据库体系,每个处所只须要150%的容量即可处置故障站点100%的生意业务。对于数据库,固然仍然须要200%6的存储,但对于任何办法该成本都是必需的。电力和装备消费也年夜约为单个站点的150%,不外我们须要的人员显然要多一些,可能操作三个数据中间须要的人员要比操作一个数据中间的人员多1.5倍。独一增长的是收集装备,因为三个数据中间比两个数据中间须要的收集衔接多两条。
采取这种设置装备摆设的一年夜利益是,可以或许应用闲置容量创立测试(如负载测试和机能测试)区域,还能应用这些闲置资本应对激增的需求。这种激增的需求随时可能涌现。我们可能要处置一些筹划外的压力,也可能关系很好的小我或公司客户获得了难以置信的病毒式的成长。那么可以先用为灾害恢复预备的容量处置生意业务,与此同时再采购新的装备。
我们提到过,运转三个或更多个数据中间也出缺点。固然我们确信三个站点都在及时工作,然则运转这三个站点还须要额外的一些庞杂工作。不外即使运转两个采取冷热设置装备摆设的数据中间,所需的庞杂工作也不比前者须要的少。同步两个站点是很难的,尤其是运维人员几乎无法证实两个站点中的某一个是否真能在需要时运行。不间断地运转三个数据中间固然会更难一些,但也不长短常难。
固然其他成本下降了,然则收集传输成本的增加也异常快。在站点的周全连通图中,每个新站点N+1都须要N条额外的收集衔接,个中N是之前站点的数量。收集衔接成本掌握得好的公司,平日都邑跟收集传输供给商谈一个批量扣头,而且还可以离开两边的脚色来充任第三方收集传输供给商,从而削减成本。
最后,我们预感到了多个及时网站制造站点的模子会造成人员及其附加的成本增长。假如数据中间很年夜,我们会把员工分派到数据中间邻近,而不是长途工作。即使没有现场工作人员,也须要不时地到现场去,与第二供给商一路工作,等等。附注栏“多个及时站点留意事项总结了实行多个及时站点的利益、缺陷以及架构方面须要斟酌的要素。