硬件冗余技术是最常见、最基本的服务器技术之一,也是应用最广的服务器通用技术。它
是通过提供双份完全•样的硬件,并通过相应的技术设备用件时刻处于待命状态,发现相应部 件失效后立即接替原来的部件继续工作,使得服务器保持恒久不间断的运作。它是提高服务器 可用性的个重要手段。根据不同的冗余部位和冗余程度,主要分为以下几种硬件冗余方式。
单机容错冗余
这是一种最卨级别的冗余,达到了 100%冗余。在这样一个服务器中,对所有部件都提 供了冗余,任何单-部件的损坏都不会造成硬盘中的数据丢失。其实这也是•种单机容错技 术,就是在台服务器中提供了两套完整的服务器配件,当然都不是简单地堆放,而是采取 了相应的技术进行连接,同时也应用了相适应的冗余部件监控和管理程序,…旦发现某部件 失效,立即启用冗余部件。它比我们后面将要介绍的双机容错技术的容错级别卨些,不过采 用这种冗余方式的代价较高,远不止两台相同服务器的价格,因为还要许多相关技术来支撑。 在实际中较少使用,除非在一些对容错性能的要求特别苛刻的环境,如金融、诎券系统等。
如阁1-36所示的是NEC公司的一款单机容错服务器。该产品是对处理器、内存、硬盘 及电源等所有主要组件均实行双重配置,实现容错。在同一时刻,双份的容错硬件部件处理 相同的指令。在一个部件出现故障的情形下,故障部件自动分离,其冗余部件就像激活了的 备份,继续正常操作。系统不会停机,也不会丢失数据。每一组双重配置的硬件均同时完成 相同的工作,为银行、证券等有着特别苛刻需求的关键领域提供高等级的可靠性。
双服务器冗余
这种冗余方式指采用双台服务器进行冗余容错,将双台服务器分为主/从服务器,从服务 器是为主服务器出现故障而准备的,不过这一容错技术需要专门的服务器集群软件来实现。 当主服务器出现故障时,从服务器将立即接替主服务器的工作,从而使得任何一台服务器出 现故障都不会造成系统崩溃。这种两台服务器冗余容错方式又有好几种不同的部署方法,具 体将在第7章中进行介绍。
如图1-37所示的是一款支持双机容错的服务器一我国宝德公司的Powerleader PL4400R服务器◊它的双机容错方案,是将两台Powerleader PL4400R服务器通过一条100 MB
网络线相连,专门用亍两台服务器的心跳检测、数据同步链路,不再占用客户机与服务器通 信时的应用网卡资源。平时,主服务器处理作业和数据,发生故障后,备用服务器自动接管
阁1-36 NEC单机容错服务器
图 1-3 7 Powerleader PL4400R 服务器
磁盘冗余
这是最常见的硬件冗余方式之一,就是提供多个备用磁盘。当然这些磁盘不是像其他冗 余部件一样消极等待,而是时刻处于激活的热备份状态,以与当前的活动磁盘保持同步。在 这种冗余方式中,应用最广的就是磁盘冗余阵列技术(RAID)。RAID技术根据冗余方式的 不同,又设置了几种不同的冗余级别。对这一技术将在后面详细介绍。
电源几余
电源冗余和下面将要介绍的风扇冗余是目前服务器中最常见的硬件冗余之一,它们都是 为了提高服务器的可用性。很明显,电源冗余就是在一台服务器中同时提供两个电源,通常 是一个电源处于工作状态,另一个电源则处于待命状态,当当前电源出现故障时,备用电源 立即接替它继续工作,使得任何一个电源故障都不会造成系统停机。如图1-38所示的是一台 具有两个电源的服务器。 *
图丨-38双电源服务器
风扇冗余
风扇冗余是指在服务器的关键发热部件上配置的降温风扇,有主、备件两套,这两套风 扇都具有自动切换功能,并支持风扇转速的实时监测、发现故障时可自动报臀并启用备用风 扇等功能。若系统正常,则备用风扇不工作,而当主风扇出现故障或其转速低于规定的标准 时,备用风扇马上自动启动,从而避免由于系统风扇损坏而导致系统内部温度升高,使得服 务器工作不稳定或停机。如图1-39所示就是一个配有两个风扇的电源,其中一个风扇就是用 来冗余的,通过监控软件时刻监控当前工作中的风扇,一旦当前风扇出现故障,立即接替它 的工作,继续为相应部件散热,而不至于因风扇出现故障部件温度过高而损坏部件。
|
网卡冗余
网卡冗余是在一台服务器中同时提供两块相同的网卡,其中一块处于工作状态,另一块 是处于待命状态(也是连接好的)。这样一旦当前工作的网卡损坏,冗余网卡可立即接替故 障网卡继续工作,不会造成网络服务中断。
其实在硬件冗余方面有的品牌还提供了 RAM、PCI适配器、网卡、内存,甚至CPU冗
■
余等技术,在此就不一一细讲了。服务器的可靠性,不仅体现在硬件的冗余上,还体现在一 些硬件在线诊断技术上,因为硬件的冗余毕竟有条件限制,我们不可能对所有配件都进行冗 余,那样会大大提髙服务器的成本。