杨政:冗余是什么

 行业动态     |      2020-11-21 17:35

  多余的重复或啰嗦内容(包括信息、语言、代码、结构、服务、软件、硬件等等)均称为冗余。冗余有两层含义,第一层含义是指多余的不需要的部分,第二层含义是指人为增加地重复部分,其目的是用来对原本的单一部分进行备份,以达到增强其安全性的目的,这在信息通信系统当中有着较为广泛的应用。

  在通信工程当中,冗余指出于系统安全和可靠性等方面的考虑,人为地对一些关键部件或功能进行重复的配置。当系统发生故障时,比如某一设备发生损坏,冗余配置的部件可以作为备援,及时介入并承担故障部件的工作,由此减少系统的故障时间。冗余尤用于应急处理。冗余可以存在于不同层面,如网络冗余、服务器冗余、磁盘冗余、数据冗余等。

  2.1 硬件冗余

  举例:

  1)电源冗余:高端服务器产品普遍采用双电源系统,这两个电源是负载均衡的,即在系统工作时它们同时为系统提供电力,当一个电源出现故障时,另一个电源会立即承担所有的负载。有些服务器系统实现了直流电源的冗余,另一些服务器产品实现了直流和交流电源的全冗余。

  2)存储子系统:存储子系统是整个服务器系统中最容易发生故障的地方,可以通过以下几种方法实现冗余:

  磁盘镜像:将相同的数据分别写入两个磁盘中。

  磁盘双联:为镜像磁盘增加一个 I/O 控制器,形成了磁盘双联,使总线争用情况得到改善。

  独立/廉价冗余磁盘阵列 RAID(Redundant Arrays of Independent/Inexpensive Disks)由 2 个以上磁盘组成,通过一个控制器协调运动机制使单个数据流依次写入这几个磁盘中,有 RAID10、RAID01、RAID0、RAID5 等级别。

  3)I/O 卡冗余:网卡冗余是指在服务器中插上多个网卡。冗余网卡技术原为大型机及中型机上的技术,现也渐被 PC 服务器所拥有。多个网卡可共同承担网络流量,且具有容错功能。

  4)CPU 冗余:系统中主处理器并不会经常出现故障,但对称多处理器(SMP)能让多个 CPU 分担工作以提供某种程度的容错。

  2.2 信息冗余

  举例:差错检查和纠错法

  2.3 软件冗余

  举例:双机集群软件、代码冗余