Posted on 2009-08-09 14:32
Prayer 阅读(833)
评论(0) 编辑 收藏 引用 所属分类:
系统、备份等
ROSE HA将冗余的硬件资源配置成一个高可用性系统。 所有的服务器可以是不同类型或不同品牌。RoseHA的工作方式 · 所有的服务器可以是不同类型或不同品牌。 ·
RoseHA 支持主从方式以及对等方式。在主从方式中,一个服务器被指定为进行关键性操作的主服务器,另一服务器作为热备份服务器。
在对等方式中,所有服务器指定为各自进行关键性操作的主服务器。两台服务器互相备份。
1.硬件组成: A· 服务器:运行同一版本操作系统的计算机系统。
l 主服务器:提供主服务的计算机系统, 但相对于其它主服务来说,主服务器也可以是备份服务器。
l 备份服务器:配置有某些用以恢复故障服务的硬件设备的计算机系统。如果主服务运行正常,没有出现故障,此时,备份服务器将处于以下三种状态之一:空闲·执行副服务·执行主服务。一台备份服务器可以装备多个硬件设备,用以恢复多个故障服务;另一方面,对一些重要的服务,也可采用ACTIVE/ACTIVE方式,这样可以进一步提高冗余度,增加系统可靠性。 B· Clients(客户端): 是指那些访问服务的计算机系统。 2.通信连接 ROSE HA支持运行TCP/IP协议的ATM·Ethernet·10M/100M以太网·光纤网 私有网:用以交换服务器心跳的网络。它可通过一条独立的网络连接来传送心跳,也可采用RS-232以点对点的通信方式来传送心跳。公有网:供客户端访问服务的网络。连接公有网最好的办法是用独立的网络连接,这样,客户端可以通过指定网络访问相关服务,从而提高系统的可靠性;其次,多个服务负载也可以由多个独立分离的网络分别承担或由一个网络独立承担。主网络接口: 此接口是客户端访问服务的入口,客户通过一个特定的网络IP地址来识别服务. 备份网络接口: (服务器间的服务恢复:)此接口是安装在备份服务器上用来提供访问主服务的备份的网络IP地址。如果主服务器出现故障,则备份服务器会将服务接管过来,且备份网络接口也会将原在主网络接口的IP地址接管过来。本地的服务恢复:可以在主服务器上另外安装一个备份网络接口,用来做备份网络接口, 这时如果主网络接口出现故障,此备份接口将接管主IP 地址, 而避免相关服务在两台服务器之间的切换。 3. 在线存储: SCSI磁盘设备私有磁盘:主要是用于存储操作系统及那些在服务被接管时不被访问的数据。共享磁盘:两台主机通过独立的访问路径访问共享磁盘。在每个服务器中都有各 自独立的供主服务使用的共享磁盘的分区,这样可保证在备份服务器接管时服务及数据的可靠性。另外,在磁盘发生故障时,还可以采取如下能保证数据可靠性的冗余及容错的磁盘介质: Mirroring(镜像) SUN在线磁盘介质; RDBMS镜像; RAID 1、3、5磁盘阵列;(一) 组件说明 1. 服务 主服务: 此服务是在指定的主服务器上运行,Client可通过连接在该服务器上的NIC上的指定的Active IP 地址来访问,主服务由HA软件来管理,当主服务器出现故障时,在很短的宕机时间内,备份服务器会将主服务接管过去。副服务: 是指不由HA管理的服务.对它而言,不存在备份服务器。副服务可以在不中断主服务的情况下随时被中断,原来分配给它的资源也会分配给主服务的接管任务中。 2. Agents Agents用来监测一些重要的硬件和软件资源的可靠性,这些资源包括如下内容: l 服务器 l 网络接口通信连接(通信服务) l 在线存储系统(文件服务,磁盘服务) l 重要的系统及相关的应用程序 判断Agents的好坏,主要可以从这样几个因素来考虑:首先,对系统资源的占用要小;对系统性能的影响要小;对错误信息要能实时反映;另外是该Agent的可靠性,不要产生重大错误,发生虚假报警。 Agents开发工具: Agents实际上是一些C(C++)程序和shell scripts。ROSE HA为要开发新的Agents的用户提供了API及模板文件。用户要检验自己应用的可靠性,必须写出精确的Agent程序或shell脚本。在ROSE HA软件中,HA管理器与Agents间的通讯是通过API来完成的,因此,用户不需再做其他的编程工作。 3. HA服务器 HA服务器(HA Daemon)是ROSE HA的核心部分。它主要完成以下工作: *监测服务器,看是否所有用来执行服务的资源都是可靠的。 *根据HA的配置文件对服务器进行配置。 *启动指定的服务. *启动服务的Agents. *通过Agents来监测服务器及服务的所有相关进程。 *管理用来恢复故障服务的冗余硬件资源。 *根据接收到的服务器心跳及Agents心跳,处理相应的事件日志、错误处理及在线恢复工作。 4. 心跳 Agents心跳: 通过周期性的Agents心跳,Agents会将服务的可靠性通知HA Daemon。Agents心跳是通过共享内存来实现的,如果服务的可用性出现问题,Agents会停止向HA管理器发送心跳。Agents心跳在预定时间内的丢失预示着它所监测的服务出现了故障,此时,ROSE HA会执行服务的切换进程。 服务器心跳: 通过周期性的服务器心跳,服务器会将自身的可靠性通知对方服务器。服务器心跳是通过基于TCP/IP 的Socket或RS-232线来传送的,如果服务器出现故障,HA管理器将向对方发送死的心跳,或停止发送心跳。此心跳在一定时间内的丢失预示着此服务器已出现故障,此时,ROSE HA将开始执行服务的切换过程。 5. HA配置文件 在每台装有ROSE HA系统的服务器中,都会产生一个配置文件,此文件就是一个根据由用户定义要求保护相关服务所定的工作表。此文件可以根据不同应用环境的要求加以修改,该配置文件主要包含以下内容: *已获得的软件许可,可以运行ROSE HA软件的所有License信息。 *配置服务:』服务的启动与停止的shell程序『服务的Agents 』所要求的硬件资源(如服务器,网卡及共享磁盘分区等等)和其各自的标识(IP地址,安装点等等)。『指定的冗余硬件设备。 *私有网的配置信息 6. Shell 程序 用户可以针对以下内容,自己编写Shell程序:* 起动和停止服务* 执行故障服务的切换* 执行事件通知:向系统控制台发送信息,通过E-mail将信息通知对方,向用户发出广播信息,初始化进程等。