亚马逊Web服务的中断'简单的存储服务(S3)不时发生,这正是您需要业务恢复策略的原因。

您的业​​务依赖于您的数据,以便您可以使用它。那么如果对这重要的AWS或任何其他云服务的停电,您的业务战略会是什么?亚马逊自豪地让您在需要时向您提供数据。这包括即使在中断过程中也可以访问数据的方法。例如, 亚马逊最近声称了 they’从未丢失过整个 数据中心。这似乎是一个罕见的情况来说,但无论亚马逊都没有完全即将到来,他们仍然存在 failsafes 在这种情况下,整个大型数据中心碰巧下降。

一个这样的 incendent 在2月28日发生的近过去发生了TH. ,2017年。许多企业提醒说“云只是别人的电脑”,作为一个 中断亚马逊Web服务的简单存储服务 (S3)受到互联网的影响。这就是为什么您需要业务恢复策略。

对于遗迹受到影响的业务,它意味着 loss 在网站不可用的时间内销售,或者也许 损失生产力直到功能恢复。 但在许多CIO,CTO和IT专业人士的思想中,它带来了问题:“如果是我的网站怎么办? 我做得足以确保我的业务继续在停电时运作吗?“

单独移动到云端不是一个灵丹妙药

云服务提供商宣传“99点 - 非常多”正常运行时间的SLA(服务级别协议),但即使是几分钟的小短暂停用可能导致SLA未命中。  These 广告SLA.,结合硬件,房地产和一些IT人员的成本节约,可以从金融角度来看云极具吸引力。 正如从昨天的事件中学到的那样,只需移动系统或数据,不一定保证100%的无事故时间。 适当的业务恢复规划需要了解您的数据所在的位置,了解您的冗余需求,以及如果服务提供商有事件,则会减轻潜在影响的计划。 

返回 Investement (ROI)

足够多少保护? 多少是太多了? 衡量投资回报始终是指标和统计数据的锻炼。 了解系统的价值 being 可用或不可用的可以帮助确定在恢复策略上花费多少钱。 

博客网站可能不值得恢复策略,但通过广告产生收入的博客网站将在中断中亏损。 损失的业务费用应衡量 cost 投资高层业务恢复策略。 

商业恢复策略的分析还应包括讨论恢复时间目标和恢复点目标(分别为RTO和RPO)。 RTO分析需要确定业务能够容忍中断的时间。 RPO分析定义了业务可能的最大期限 容忍数据丢失

由于广告收入丢失,前一个例子中的博客站点可能具有低阈值的恢复时间,但站点上的数据可能只会每周更改一次,因此在最快的情况下具有更高的恢复点的阈值恢复过程是从备份中还原。 考虑对分析中的两个因素来确定足够的保护程度。 

多区域冗余

AWS S3事件仅限于 区域名为Use-East-1而且区域彼此隔离。 此外,存在用于使用区域特定端点的选项(即 http://s3-eu-west-1.amazonaws.com),但如果默认端点(http://s3.amazonaws.com)被使用,这是 默认通过美国东部地区进行路由 用于重定向到正确的端点。 虽然该事件仅限于美国东-1地区,但如果网站依赖于重定向,则该问题可能更广泛。 

如果您的网站拥有,因此区域被彼此隔离 跨域复制 在S3存储桶上设置,所有对象都已复制,并且您可以将应用程序重定向到不同的S3存储桶中,网站所有者本可以采取一些步骤尝试还原服务。 

由于实际的根本原因尚不为本,因此无法确定是否会更快地恢复服务,但如果您有一个了解系统和布局的IT团队,甚至是云中的IT团队,可能有很多选择。

主动测试

关于跨区域复制的先前陈述包含了很多“ifs”。 

  • “如果”您有跨区域复制设置 
  • “如果”所有对象已被复制
  • “如果”应用程序可以重定向

知道您的团队恢复策略是否要上班的唯一方法是通过测试恢复程序,通常足以对他们有信心。 你不想在恢复情况下试图弄清楚这一点。 

业务恢复策略的冗余部分

你听说过“不要把所有的鸡蛋放在一个篮子里”。 根据您的数据的关键性,您可能不想将所有数据存储在一个云提供商中。 此选项可能昂贵且复杂,因此返回到ROI计算,以确定您将从存储的数据中获益多大。 

AWS,Microsoft Azure,Rackspace等提供企业级存储选项,另一种选择是具有混合云/内部部门解决方案。 是的,您可能已经去云端摆脱本地系统,但根据您的ROI指标,混合恢复解决方案可能比多个云提供商解决方案做出更多的财务意义。

评估您的情况

您的系统的停机可能导致业务,收入或生产力损失,所有这些都等同于实际美元和美分。无论您的系统居住在哪里,S3中断都是一个提醒,以评估您的业务恢复策略和程序,以确保在事件发生损坏。不要等到它为时已晚。

Source://blog.ipswitch.com/topic/monitoring