云计算的可靠性（可用性）如何？

Aba ·

更新时间:2024-11-14

· 796 次阅读

前面我们讲过 IT 的概念，即信息技术，其中“I”代表信息（或数据），“T”代表技术（或计算），技术是用来处理信息的，所以说 I 是目的，T 是手段，T 是为 I 服务的。
《云计算安全性》教程中关注的是 I，本节我们再来看看 T，与 T 关联的安全主要是“计算可用性”，如果由于 T 的原因，人们无法处理 I，那么这种情况就称为计算不可用。
首先来看下面几个计算不可用的例子：停电，计算机无法开机，所有的计算机软件都无法使用。操作系统损坏，计算机启动失败，保存在 U 盘上的数据完好无损，但是无法浏览和编辑。别人传了一个 PPT 文件给我，但是计算机上没有安装 Office 办公软件，所以我无法打开这个 PPT 文件。网络断了，无法通过 QQ 与外界联系，也无法上网和收发邮件。音箱坏了，而且没有耳机，所以无法使用计算机看电影。我忘记了公司 ERP 的登录密码，所以无法使用财务系统。
计算不可用会导致人们无法处理全部或者部分数据，而断电、断网、软/硬件故障、缺少应用软件、忘记账号或密码等都会导致全部或部分计算不可用。
相对于传统 IT 系统而言，云计算的确增加了一个可能产生故障的环节——云端，而且一旦云端崩溃，影响范围会很广，但不能因此而全盘否定云计算，因为世上根本就没有完美无缺的事物。
一个公安局长在否决私有云建设方案时说的一句话：“万一云端出问题，大家都不用办公了？！”从正面回答公安局长的问题，估计效果不大，可以顺着其思路提出如下类似的问题：
万一银行的数据中心出问题，大家都不用取钱了？！所以银行不应该建立数据中心，但目前银行都建立了数据中心并实现了数据大集中。万一电厂出问题，所有的电器设备都不能用了？！所以家家都要自备发电机发电，但今天谁会自备发电机呢？万一移动公司的数据中心出问题，大家都不用手机了？！但目前几乎人人都在用手机。万一自来水厂出问题，大家都不用水了？！尽管存在这种断水的可能性，但哪家还会自挖水井呢？万一地球发生爆炸，大家都不用活命了？！所以人根本不应该活着，而实际情况是活着的我们有谁总担心地球发生爆炸呢？
类似的问题还有很多，不再一一列出。我的一个好朋友从 1994—2002 年在银行工作，从事计算机技术岗位，见证并参与了银行从完全手工办理业务（算盘、手写存折）到全国数据大集中并实现网上银行的整个发展过程。1996 年以前，人们只能到开户行去存取款；而今天，我们不但能异地跨行存取款，而且坐在家里通过网上银行就能轻松实现支付和转账。总之，银行数据大集中利大于弊。
为了确保银行数据中心的可靠性，每家银行一般会在不同城市（如北京、上海和西安）各建一个中心，平时一个中心工作，另外两个作为灾备中心，三个中心的数据实时同步更新。这样，就算战争、地震等损毁了两个中心，也不会影响银行业务的正常办理。即使三个中心全部遭到破坏，也还有离线备份的数据，数据安全性绝对没有问题。
决策者和云计算工程师们会在计算的重要性和成本之间综合权衡，以建设一个令各方都满意的云端。
例如，一个全国性的关系到每个人利益的公共云，就会考虑在不同的城市建立灾备云端，在另一个国家建立数据备份中心；一个涉及全省的公共云，可能会考虑在其他省的城市建立数据备份中心；一个世界500强企业的私有云，可能会建立一个异地灾备云端；一家中型企业的私有云，可能会引入集群、容错和故障转移技术；即使一家只有十几个人的小型公司的私有办公云，也会采用双机容错技术，只有当两台服务器同时出现故障时才会影响办公，但同时出现故障的概率几乎可以忽略不计，除非发生断电或地震等不可控事件。
就像银行数据中心的演化过程，IT 系统也遵循“手工→单机→私有云→公共云”的发展过程，每一次演化带来的好处要远远大于引入的弊端。
即使没有使用云计算的企业，在其 IT 系统中，也存在不少“单点故障”——一出问题就会影响整个企业的业务办理。比如企业的邮件系统、门户网站、ERP 系统、文件服务器、局域网接入认证系统等，即 C/S 或 B/S 的 S 端（服务器端）就是单点故障点。导致计算不可用的主要原因有停电、断网、硬件故障、软件故障（含病毒感染）。
在传统 IT 系统中，个人计算机的软、硬件故障导致计算不可用的概率接近 95%，其中又以软件故障最为普遍，而因停电、断网导致计算不可用的概率微乎其微，服务器故障导致计算不可用的概率还不到 5%。而当一家企业采用云计算后，云终端是一个纯硬件、低功耗产品，而且 CPU、内存都焊死在主板上，又没有硬盘，所以云终端出故障的概率几乎可以忽略不计。
云端采用多路供电、恒温恒湿系统，引入集群技术、容错技术及负载均衡技术等措施确保计算持续可用，这样由云端、网络、终端组成的云计算系统具备极高的可靠性和安全性，计算可用性非常高。

可靠性可用性云计算

1024 个赞