Amazon Web Services的简单存储服务(S3)经常会中断,这正是您需要业务恢复策略的原因。

您的业​​务依赖您的数据随时随地可用。那么,如果与此有关的AWS或任何其他云服务中断,您的业务战略是什么?亚马逊以在需要时为您提供访问数据的自豪感。这包括即使在中断期间也可以访问数据的方法。例如, 亚马逊最近声称 they’我从来没有失去过整个 datacenter. That seems like a rare situation to say 日e least, but regardless of if Amazon is not 存在 entirely forthcoming or not, 他们 still have failsafes 在整个大型数据中心发生故障的情况下就位。

一个这样的 incendent 最近发生在2月28日,2017年。许多企业被提醒,“云只是其他人的计算机”, Web服务的简单存储服务中断 (S3)影响了整个互联网上的网站。这就是为什么您需要业务恢复策略的原因。

对于网站受到影响的企业,这意味着 loss 网站不可用期间的销售量,或者也许 在恢复功能之前生产力下降。 但是,在许多CIO,CTO和IT专业人员的心中,它带来了问题:“如果这是我的网站怎么办? 我是否已做足够的工作来确保我的业务在发生故障时仍能继续运作?”

独自迁移到云端并非万能药

云服务提供商宣传SLA(服务水平协议)的正常运行时间为“ 99点非常多”,但是即使是短暂的短暂中断也可能导致SLA丢失。  These 广告SLA从财务的角度来看,再加上节省的硬件,房地产和一些IT员工的成本,可以使迁移到云非常有吸引力。 从昨天的事件中得知,仅将系统或数据移至异地并不一定保证100%的无事件时间。 正确的业务恢复计划需要了解您的数据所处的位置,了解您的冗余需求,以及一项在服务提供商发生事件时减轻潜在影响的计划。 

返回 Investement (ROI)

多少保护才足够? 多少是太多了? 衡量投资回报率始终是衡量指标和统计数据的一种方式。 了解系统的价值 being 可用或不可用可以帮助确定值得在恢复策略上花费多少。 

博客网站可能不值得采用恢复策略,但是通过广告产生收入的博客网站会因断电而蒙受损失。 损失的业务成本应按 cost 投资于更高层次的业务恢复策略。 

业务恢复策略的分析还应该包括确定恢复时间目标和恢复点目标(分别为RTO和RPO)。 RTO分析需要确定业务可以容忍多长时间。 RPO分析定义了企业可以达到的最长期限 tolerate data 失利

上一个示例中的博客网站可能由于广告收入损失而具有较低的恢复时间阈值,但是该站点上的数据可能每周仅更改一次,因此在最快的情况下具有较高的恢复点阈值恢复过程是从备份还原。 考虑分析中的两个因素,以确定多少保护就足够了。 

多区域冗余

AWS S3事件仅限于 名为US-EAST-1的区域,并且区域彼此隔离。 此外,存在使用特定于区域的端点的选项(即 http://s3-eu-west-1.amazonaws.com),但默认端点是http://s3.amazonaws.com),这是 默认情况下通过美国东部地区路由 重定向到正确的端点。 尽管此事件仅限于US-EAST-1地区,但如果站点依赖重定向,则问题可能会更加普遍。 

由于区域彼此分隔,因此如果您的网站 跨区域复制 在S3存储桶上进行设置,并且所有对象均已复制,并且您能够将应用程序重定向到其他S3存储桶,站点所有者可以采取一些步骤来尝试还原服务。 

由于实际的根本原因尚不清楚,因此无法确定是否可以更快地恢复服务,但是如果您的IT团队知道系统和布局(甚至是云中的系统和布局),则可能有很多选择可以更快地恢复。

主动测试

先前有关跨区域复制的陈述包含很多“ if”。 

  • 如果设置了“跨区域复制” 
  • “如果”已复制所有对象
  • “如果”应用程序可以重定向

知道您的团队的恢复策略是否可行的唯一方法是经常测试恢复过程以对它们有信心。 您不希望自己处于恢复状态,而是第一次尝试解决该问题。 

业务恢复策略中的冗余部分

您听说过“不要把所有鸡蛋都放在一个篮子里”的说法。 根据数据的重要性,您可能也不想将所有数据存储在一个云提供商中。 此选项可能既昂贵又复杂,因此请返回该ROI计算,以确定将数据存储在多个提供商中将为您带来多少收益。 

AWS,Microsoft Azure,Rackspace等提供了企业级存储选项,另一个选择是拥有混合云/本地解决方案。 是的,您可能已经去了云以摆脱本地系统,但是根据您的ROI指标,混合恢复解决方案可能比多云提供商解决方案更具财务意义。

评估你的情况

Downtime for your systems can result in 失利 of business, revenue, or productivity, all of which equate to real dollars and cents.  No matter where your systems reside, 日e S3 outage is a reminder to assess your business recovery strategy and procedures, to ensure 日at 日e damage is minimized in 日e event of an incident.  Don’t wait until it’s too late.

Source://blog.ipswitch.com/topic/monitoring