资讯中心

应对计算需求突增 云爆发只是泡沫?

  

虽然云爆发的概念听起来不错,但是将突然增加的计算需求转移到公有云中仍然存在诸多问题。

由于只需在真正使用时才支付费用,因此云爆发这种方式引发了很多人对于公有云计算的兴趣,包括高级管理层以及面临预算限制的IT经理们。混合云能够在需求高峰时将负载弹性转移到公有云当中,而当需求减少时再将规模缩减,运行在本地服务器当中。这种方式可以让大型企业不必支付高昂费用就能获得有保障的无限制和不间断服务。

很容易理解为何云爆发如此具有吸引力。在混合云模型当中,负载能够在不同云之间无缝迁移、动态适应不断变化的需求,这是IT部门及时响应业务部门需求的典型案例。然而事实上,想要让突然增加的本地负载使用距离较近、无限制的公有云资源不仅仅是一个令人头疼的问题,对于大多数企业来说,这都是不可能实现的。

“我不认为这种方式会像大家期望的那么流行,” The Virtualization Practice公司首席分析师Edward Haletky表示,“如果想要实现这种程度的自动化,企业需要绝对信任自动化机制,并且实施恰当的监控和控制。所有公司都能够做到这些吗?我知道有些公司可以,但是它们都是规模非常庞大的公司。”

云爆发面临哪些挑战

Midwestern大学的虚拟化和云架构师Bob Plankers表示,尽管云爆发的概念非常吸引人,但是在将本地应用程序扩展到公有云的过程当中依然会面临很多复杂问题。这些挑战甚至超过了云爆发本身具有的优势,因此在某些环境当中购置几台全新服务器也许是一种更为高效的办法。

“本地计算环境和公有云之间可能存在严重的网络延迟,”Plankers表示。“很多企业在考虑这种方式之前并没有评估Internet出口带宽。延迟会导致应用程序响应缓慢,而应用程序响应缓慢正是企业最应该避免的问题。”

云爆发究竟是什么?

尽管大家对于云爆发的最终目标已经达成广泛一致——处理计算需求方面的临时性快速增长——但是很多专家和分析师在其必要性方面依然持有不同意见。专家同意可以将突然增加的本地负载迁移到云环境当中,然而,他们并不认为迁移的目标只能是公有云(还可以是私有云),并且迁移和返回的过程都是自动实现的。最后,如果企业能够成功处理需求峰值的问题,那么如何称呼这个过程其实并不重要。

大多数企业的传统应用程序并不支持无缝扩展到云中。考虑到这种情况,如果企业的会计部门正在进行年终结算,那么肯定会导致ERP系统出现负载峰值。IT管理员也许会考虑分配一个新的前端引擎来处理这种需求,但是其仍然需要和后端SAP系统进行通讯,药物研发公司AbbVie基础架构师Keith Townsend表示。

“如果数据仍然保存在本地数据中心,那么在云中使用新的引擎并不会起到任何作用,”Townsend说,“相对来说在私有数据中心当中创建新的虚拟机将会是一种更加简单和廉价的方式。”

网络是采用现代方式处理云爆发的另外一种主要挑战之一,但是这种挑战不止限于传输延迟和连接速度而已。如果应用程序在本地服务器和公有云之间同时运行,那么安全性会变得更为复杂,Townsend表示。

“(如果在本地数据中心)我可以在网络层的两台防火墙当中设定两条策略,监视两台Web服务器之间的流量,但是如果我将突然增加的负载转移到云中,那么谁来保证安全性、谁来实现日志记录?”他说,“如果对我进行外部审计,我该怎么办?”

即便IT部门能够应对基础架构方面的挑战,云爆发仍然会带来大量管理和业务方面的问题。在很多情况当中,性能的提升往往伴随着复杂性增加,Haletky表示。

“许多人都谈论这个美好的故事,但是我不知道究竟有多少家企业真正采用了云爆发这种方式,因为你必须拥有非常高的自动化程度,”Haletky说道,“多少家公司能够达到那样的自动化程度?Netflix公司可以,但是所有公司都能像Netflix公司一样吗?”

如果采用云爆发这种方式,那么需要提前计划,也就是在云中提前部署虚拟机镜像和数据,以便在应用程序出现负载峰值时公有云能够及时接管部分负载。对于能够预测未来需求的业务来说,这并非是不可解决的问题,但是管理员难以决定的是到底需要公有云提供多少性能以及为这些随时就绪的数据愿意支付多少费用。

讽刺的是,使用云爆发这种方式的最初目的之一就是缩减费用支出、减低成本,但是最后却事与愿违。

“如果我将某项任务自动化,但是并没有让其完成之后自动关闭,那么就可能会导致整体开销上升,”Haletky说。“处理负载爆发的整体思路就是在需要时运行,在一切正常之后返回到默认状态。如果从Amazon购买20台新的Web服务器,那么每小时都会产生巨额开销。”

为不稳定的应用程序制定计划

处理计算需求突增最简单的,通常也是最廉价的解决方案仍然是传统方式,在本地预留出足够的服务器性能,专家表示,这种方式并不一定意味着购买新的服务器。评估是否需要将突然爆发的负载转移到云中的第一步就是评估当前资源的使用情况,Townsend表示。

“在很多情况当中,我们应该关注的重点不是如何将突发负载迁移到云中,而是检查企业的现有工作效率多么低。”Townsend说道,“让我们评估一下现有资源,之后合理调整资源以便拥有足够的性能来完成所有任务。”

对于那些遇到更大规模需求变化或者真的缺少性能的企业来说,使用Puppet和Chef这样的自动化工具,配合虚拟化和云管理平台,可以帮助它们构建一个灵活的混合云。然而,现在有很多新的厂商尝试采用独特方式来降低云爆发的复杂性。

Ravello Systems公司帮助企业映射应用程序依赖关系、管理网络配置、将整个应用程序栈克隆到云当中。然而,大多数用户并没有选择将生产环境当中的突发应用克隆并迁移到公有云当中,而是采用一种不同的方式,Ravello公司产品市场总监Shruti Bhat表示。

“我们看到用户仍然将生产环境应用程序放在自己的数据中心当中,而将其他环境当中的负载迁移出去,这样就能够为生产环境预留足够性能和空间,比如将开发和测试环境迁移到公有云当中,”Bhat说,“这仍然算是云爆发的一种方式,但是这样做就不用再担心性能问题以及通过VPN连接应用程序和将数据保存在其他位置所带来的安全风险了。”

Ravello的客户包括在线游戏公司888poker,将QA和证书环境迁移到了公有云当中,还有两家大型银行使用Ravello的产品运行网络安全实验室克隆环境。当本地性能达到峰值时,Red Hat也在其OpenStack培训课程当中使用Ravello的产品,为学生提供多服务器实验环境。Bhat说,“Red Hat发现每次学生登陆的时候,他们都需要分配一个快速建立的OpenStack环境,如果为每位学生分配5到6台服务器,那么数据中心的资源将会很快耗尽。当学生登录的时候,他们会让学生访问数据中心当中的服务器,而当数据中心当中的资源用尽的时候,他们开始让学生访问Ravello所提供的OpenStack资源。”