興迪資訊科技有限公司

New Design Information Technologies Ltd.

HP MC
來源: | 作者:pro46dade | 發布時間: 2017-08-28 | 856 次浏覽 | 分(fēn)享到:

集群軟件MC/ServiceGuard概述

1.高可靠性

MC/ServiceGuard (Multi-Computer/ServiceGuard)是專門用來保護關鍵業務應用免遭軟、硬件故障影響的軟件結構。使用MC/ServiceGuard,多個節點(系統)被組織成一(yī)個企業群集,爲LAN上的客戶機提供高可用性的應用服務。MC/ServiceGuard監視程序監視每一(yī)個節點狀态,并且對出現的故障很快做出反應,使應用程序的停頓成爲最小(xiǎo)。MC/ServiceGuard可自動對下(xià)列部件的故障作出響應:

   --系統處理器
   --系統内存
   --局域網介質和網卡
   --系統進程
   --應用程序進程

因爲高可靠性是設計的重要目标,這種群集不會因任何“單點故障”(Single point of failure)而停止服務。

 

2.平衡工(gōng)作負荷

MC/ServiceGuard的應用程序包提供一(yī)種強有力的、靈活的機制用來在群集内部一(yī)個節點發生(shēng)故障時,平衡各節點的工(gōng)作負荷。在一(yī)個節點内的各個應用程序可移到不同的節點上,這樣在群集的各個節點上分(fēn)散工(gōng)作負荷。例如,一(yī)個群集有4個節點,每一(yī)個節點運行三個軟件包。如果某個節點發生(shēng)故障,該節點上正運行的三個軟件包會被分(fēn)散到不同的節點上,把發生(shēng)故障節點的工(gōng)作負荷分(fēn)配到剩下(xià)的三個好節點上,這樣可使群集中(zhōng)其餘的應用性能所受的影響降至最低。

MC/ServiceGuard可以按二種不同的恢複策略進行配置:活動一(yī)活動和活動一(yī)備用。在活動一(yī)活動配置中(zhōng),每個節點至少運行一(yī)個應用軟件包,并爲運行在其他節點上的一(yī)個或多個應用程序提供備份服務。在活動一(yī)活動配置方式下(xià),沒有空閑的系統,這充分(fēn)利用群集内每個節點的能力。

MC/ServiceGuard也允許節點按活動一(yī)備用方式配置,這樣配置可在主系統發生(shēng)故障時,将所有備用節點的處理能力重新分(fēn)配給應用軟件包。備用節點可供非關鍵性業務使用,一(yī)旦關鍵性應用程序包從主系統轉達來,就立即中(zhōng)止原來的工(gōng)作。活動-備用方式配置保證在故障恢複後,關鍵業務應用的響應時間不會變差。

 

3.保護數據完整性

在企業群集中(zhōng),MC/ServiceGuard不僅使應用程序有效可靠,而且采取特别方法保護數據完整性。當應用程序包從故障節點移出時。群集中(zhōng)其他節點互相協調确保失效節點不會危及應用數據的完整性。每個節點都知(zhī)道群集中(zhōng)的其他成員及分(fēn)配給它們的應用軟件包。如果一(yī)個節點發生(shēng)故障,剩下(xià)的節點會把其從群集中(zhōng)隔離出來以防止其訪問磁盤。這一(yī)重要功能可以防止一(yī)個節點發生(shēng)故障挂起或重啓動後,不會再對現在己由别的節點負責的數據進行改寫(稱這種情況爲“Splitbrainsyndrome”)。如果沒這種防護,數據完整性就會由于有多個節點同時訪問一(yī)個磁盤而遭到破壞。

 

4.集成MC/ServiceGuard群集和網絡節點管理程序

ClusterView是一(yī)個具有業界領先功能的新産品,用于本地或遠程群集的集中(zhōng)式網絡管理。與HP OpenView的網絡節點管理程序(NNM)一(yī)起,ClusterView可以讓網絡管理人員觀察MC/ServiceGuard群集的狀态。利用一(yī)種“drill down”的功能,網絡管理員可以觀察整個群集、群集中(zhōng)的每個節點以及每個節點上應用程序的狀态。這些能力大(dà)大(dà)加強了網絡群集管理,當與其他産品如進程資源管理程序(PRM)一(yī)起使用時,能大(dà)大(dà)提高網絡管理員下(xià)列方面的能力:問題預測、檢測和分(fēn)析;性能調整以及工(gōng)作負荷平衡。

MC/ServiceGuard的原理及配置

1.MC/Services Guard的工(gōng)作原理

MC/Services Guard軟件由三部分(fēn)組成(如圖2所示)。 

   1)集群管理器(Cluster Manager

   集群(Cluster)由節點(Node)組成,而節點就是生(shēng)産機、備份機。隻有在MC/Services Guard的管理下(xià),各個節點才能組成一(yī)個集群,其中(zhōng)的生(shēng)産機節點稱爲集群協調器(Cluster Coordinator)。集群協調器接受各節點發送的心跳線消息,可知(zhī)節點狀态。如果某個節點狀态不正常,MC/Services Guard試圖形成新的cluster,新的cluster中(zhōng)不包含不正常的節點。新的cluster的配置信息将傳給包管理器,使得應用系統不再在不正常的節點上運行。

   舊的cluster失敗形成新的cluster時,原來的cluster分(fēn)裂成兩個子群(sub-cluster,每個子群都試圖成爲生(shēng)産機。這時哪個子群首先獲得鎖盤,則該子群成爲生(shēng)産機,另一(yī)個子群隻能成爲備份機。如果存在三個節點,則不需要鎖盤。

   2)包管理器(Package Manager

   包是運行應用所需的後台進程和服務的總稱。包管理器的作用是:
      --決定何時在何節點運行、挂起、遷移package
      --執行用戶定義的控制文本從而正确的挂起和運行package

   3)網絡管理器(Network Manager

   每個節點的當前活動網卡(主網網卡)應配置其IP地址,這是靜态的IP地址,由配置文件/etc/rc.config.d/netconf文件決定。靜态的IP地址不會傳給另一(yī)個節點,但可以傳給備份網卡,所以一(yī)定不要配置備份網卡的IP地址。

   此外(wài),對于每個package應配置其唯一(yī)的IP地址,這就是浮動地址(Floating Address)。cluster中(zhōng)的每個節點的浮動地址是相同的,并與主網靜态IP地址處于同一(yī)網段。啓動package時,該浮動地址将分(fēn)配給主網網卡。主網網卡出現故障時,主網的靜态IP地址和package地址都将切換到備份網卡。所以對于應用來講,訪問package時無須知(zhī)道當前節點的靜态IP地址或主機名。

 

2.MC/Services Guard配置注意事項 

   1)除網絡地址外(wài),生(shēng)産機和備份機的MC/Services Guard配置是完全一(yī)樣的。

   2)如果存在兩個以上應用(如計費、營業、帳務處理等),則後台程序可以集中(zhōng)在生(shēng)産機上運行,也可以分(fēn)布在生(shēng)産機、備份機上運行。分(fēn)布運行可以提高小(xiǎo)型機的利用率。多個應用可以隻有一(yī)個package,也可有多個package。對應每個package,都有其相應的配置文件。

   3)配置文件中(zhōng)的 SUBNET是指浮動地址,VOLUME_GROUP是指在磁盤陣列和鎖盤上定義的卷組(分(fēn)兩行或多行記錄)AUTOSTART_CMCLD決定機器啓動時是否自動啓動MC/Services Guard,一(yī)般雙機都置爲1

   4)在文件/etc/hosts中(zhōng)指明浮動地址時,絕對不能以空格或TAB鍵作爲一(yī)行的開始。