Windows Server 2008的故障轉移群集入門
本文介紹Windows Server 2008故障轉移群集的操作步驟,包括硬件、軟件和網(wǎng)絡基礎結構的準備、安裝、創(chuàng)建、配置等內容。一、準備故障轉移群集必須滿足硬件、軟件和網(wǎng)絡基礎結構的某些要求,并且它
本文介紹Windows Server 2008故障轉移群集的操作步驟,包括硬件、軟件和網(wǎng)絡基礎結構的準備、安裝、創(chuàng)建、配置等內容。
一、準備
故障轉移群集必須滿足硬件、軟件和網(wǎng)絡基礎結構的某些要求,并且它需要一個具有適當域權限的管理帳戶。具體如下:
(一)故障轉移群集的硬件要求
在一個故障轉移群集中,需要配備有以下硬件:
(1)服務器:建議使用一組包含相同或相似組件的匹配計算機。
注意,僅當所有硬件組件均標記為"Certified for Windows Server 2008"時,
Microsoft 才支持故障轉移群集解決方案。此外,完整配置(服務器、網(wǎng)絡和存儲)必須通過" 驗證配置" 向導中的所有測試,該向導包含在故障轉移群集管理單元中。
(2) 網(wǎng)絡適配器和電纜(用于網(wǎng)絡通信):與故障轉移群集解決方案中的其他組件一樣,網(wǎng)絡硬件必須被標記為" 針對 Windows Server 2008 進行了認證" 。如果使用 iSCSI,則必須將網(wǎng)絡適配器專用于網(wǎng)絡通信或 iSCSI,而不能同時用于兩者。
在將群集節(jié)點連接在一起的網(wǎng)絡基礎結構中,要避免具有單個故障點。實現(xiàn)這一點有多種方法??梢酝ㄟ^多個不同網(wǎng)絡來連接群集節(jié)點?;蛘撸梢酝ㄟ^一個網(wǎng)絡來連接群集節(jié)點,該網(wǎng)絡由成組網(wǎng)絡適配器、冗余交換機、冗余路由器或可消除單故障點的相似硬件組成。
注:如果你是通過一個網(wǎng)絡來連接群集節(jié)點,則該網(wǎng)絡需滿足驗證配置向導中的冗余要求。但是,該向導中的報告將包含一條警告,指明網(wǎng)絡不應具有單故障點。
(3) 用于存儲的設備控制器或相應適配器:
- 對于串行連接 SCSI 或光纖通道:如果您在所有群集服務器中使用的是串行連接 SCSI 或光纖通道,則專用于群集存儲設備的海量存儲設備控制器應相同。它們還應使用相同的固件版本。
注:通過 Windows Server 2008,您無法使用并行 SCSI 將存儲連接到群集服務器。 - 對于 iSCSI:如果你使用的是 iSCSI,則每臺群集服務器必須具有一個或多個專用于群集存儲設備的網(wǎng)絡適配器或主機總線適配器。不能將用于 iSCSI 的網(wǎng)絡用于網(wǎng)絡通信。
,在所有群集服務器中,用來連接到 iSCSI 存儲目標的網(wǎng)絡適配器應相同,建議使用 Gigabit 以太網(wǎng)或更高速的以太網(wǎng)。
對于 iSCSI 而言,不能使用成組網(wǎng)絡適配器,因為它們不受 iSCSI 支持。
- 存儲:必須使用與 Windows Server 2008 兼容的共享存儲。
多數(shù)情況下,存儲應包含在硬件級配置的多個獨立磁盤 (LUN)。對于某些群集,使用一個磁盤作為見證磁盤。其他磁盤則包含群集服務或應用程序所需的文件。存儲要求包括下列各項:
- 若要使用故障轉移群集中包含的本機磁盤支持,請使用基本磁盤,而不要使用動態(tài)磁盤。
- 建議以 NTFS 格式對分區(qū)進行格式化(對于見證磁盤,分區(qū)必須為 NTFS 格式) 。
- 對于磁盤的分區(qū)形式,可以選擇使用主啟動記錄 (MBR) 或使用 GUID 分區(qū)表 (GPT)。 見證磁盤是群集存儲中的一個磁盤,它被指定用于保存群集配置數(shù)據(jù)庫的一個副本。只有在將見證磁盤指定為仲裁配置的一部分的情況下,故障轉移群集才會具有見證磁盤。
(二)故障轉移群集的軟件要求
一個故障轉移群集中的所有服務器必須運行相同版本的 Windows Server 2008。服務器可以運行以下任一版本的操作系統(tǒng):
- Windows Server 2008 Enterprise
- Windows Server 2008 Datacenter
- Windows Server 2008 Enterprise 的服務器核心安裝
- Windows Server 2008 Datacenter 的服務器核心安裝
另外,所有服務器必須運行相同硬件版本的操作系統(tǒng)(32 位、基于 x64 或基于 Itanium 體系結構)。例如,如果一臺服務器運行的是基于 x64 版本的 Windows Server 2008 Enterprise,則故障轉移群集中的所有服務器都必須運行該版本。
所有服務器還應具有相同的軟件更新(修補程序)和 Service Pack。
(三)故障轉移群集的網(wǎng)絡基礎結構和域帳戶要求
將需要以下故障轉移群集的網(wǎng)絡基礎結構和擁有以下域權限的管理帳戶:
,- 網(wǎng)絡設置和 IP 地址:當針對網(wǎng)絡使用相同的網(wǎng)絡適配器時,還要在這些適配器上使用相同的通信設置(如速度、雙工模式、流控制和媒體類型)。另外,還要比較網(wǎng)絡適配器與它所連接的交換機之間的設置,并確保設置不發(fā)生沖突。
如果所擁有的專用網(wǎng)絡未路由到網(wǎng)絡基礎結構的其余部分,則確保每個此類專用網(wǎng)絡都使用唯一的子網(wǎng)。這樣做非常必要,即使為每個網(wǎng)絡適配器分配了唯一的 IP 地址也是如此。例如,如果在使用一個物理網(wǎng)絡的總部中擁有兩個群集節(jié)點,在使用單獨物理網(wǎng)絡的分支機構中擁有另外兩個節(jié)點,則不要同時為兩個網(wǎng)絡指定 10.0.0.0/24,即使為每個適配器分配了唯一的 IP 地址也是如此。
- DNS:群集中的服務器必須使用域名系統(tǒng) (DNS) 來進行名稱解析??梢允褂?DNS 動態(tài)更新協(xié)議。
- 域角色:群集中的所有服務器必須處于相同的 Active Directory 域中。最好的做法是,所有的群集服務器應具有相同的域角色(成員服務器或域控制器)。建議的角色為成員服務器。
- 域控制器:建議的群集服務器為成員服務器。如果它們是成員服務器,則其他服務器將是包含故障轉移群集的域中的域控制器。
- 客戶端:對于客戶端來說,除了連接和兼容性方面的明顯要求外,沒有特定要求:客戶端必須能夠連接到群集服務器,并且,它們必須運行與群集服務器提供的服務兼容的軟件。
- 用于管理群集的帳戶:首次創(chuàng)建群集或者向群集中添加服務器時,必須使用對該群集中所有服務器具有管理員權限的帳戶登錄到域。該帳戶無需是 Domain Admins 帳戶 - 它可以是位于每個群集服務器上的 Administrators 組中的一個 Domain Users 帳戶。另外,如果該帳戶不是 Domain Admins 帳戶,則必須為該帳戶(或該帳戶是其成員的組)委派域中的" 創(chuàng)建計算機對象" 權限。
注:與 Windows Server 2003 相比,Windows Server 2008 中群集服務運行的方式發(fā)生了變化。在 Windows Server 2008 中,沒有群集服務帳戶。群集服務將在一個提供了服務所需的特定權限的特定上下文中自動運行(與本地系統(tǒng)上下文相似,但權限減少)。
二、安裝
對于服務器集群的概念大家可能并不陌生,在Windows Server 2008中,它被賦予了新的名字:故障轉移集群。一個群集就是一組協(xié)同工作以提高服務和應用程序可用性的獨
,立計算機。多臺群集服務器(稱為節(jié)點)之間由物理電纜和軟件連接。如果其中一個節(jié)點出現(xiàn)故障,另外一個節(jié)點就會通過稱為故障轉移的一個進程開始提供服務。
在 Windows Server 2008 中,對故障轉移群集進行改進的目的是為了簡化群集,使它們更加安全,并增強群集穩(wěn)定性。群集設置和管理更加容易。同故障轉移群集與存儲進行通信的方法獲得改進一樣,群集中的安全性和聯(lián)網(wǎng)也得到了改進。
需要注意的是,故障轉移群集功能包含在 Windows Server 2008 Enterprise 和 Windows Server 2008 Datacenter 中。而 Windows Server 2008 Standard 或 Windows Web Server 2008 中則不具有這樣的特性。
安裝故障轉移群集功能
以管理員身份登陸,可通過使用" 初始配置任務" 或" 服務器管理器" 中的" 添加功能" 命令安裝" 故障轉移群集" 。具體步驟如下:
1. 如果最近已在服務器上安裝 Windows Server 2008,并且已顯示" 初始配置任務" 界面,則在" 自定義此服務器" 下單擊" 添加功能" 。(跳到步驟 3。)
2. 如果未顯示" 初始配置任務" ,則通過" 服務器管理器" 來添加功能:
- 如果服務器管理器已運行,則在" 功能摘要" 下單擊" 添加功能" 。
- 如果服務器管理器沒有運行,則單擊" 開始" ,單擊" 管理工具" ,單擊" 服務器管理器" ,然后,如果出現(xiàn)提示需要具有繼續(xù)的權限,則單擊" 繼續(xù)" 。然后,在" 功能摘要" 下,單擊" 添加功能" 。
3. 在" 添加功能向導" 中,單擊" 故障轉移群集" ,然后單擊" 安裝" 。
4. 向導結束時,將其關閉。
5. 為要包括到群集的每臺服務器重復該過程。
至此,故障轉移群集功能安裝完畢,接下來即可進行故障轉移集群的創(chuàng)建。
三、創(chuàng)建
當你的硬件環(huán)境完全滿足故障轉移集群的創(chuàng)建條件,并且已經(jīng)完成了故障轉移集群功能的添加。接下來即可進行故障轉移集群的創(chuàng)建。
創(chuàng)建新故障轉移群集
1. 確認已按下列主題所述連接了硬件并且驗證了硬件配置:
,- 驗證故障轉移群集之前準備硬件
- 驗證新的或現(xiàn)有的故障轉移群集。
注:僅當完整配置(服務器、網(wǎng)絡和存儲)可以通過" 驗證配置" 向導中的所有測試時,Microsoft 才支持故障轉移群集解決方案。另外,解決方案中的所有硬件組件均必須標記為"Certified for Windows Server 2008"。
2. 在" 故障轉移群集管理" 管理單元中,確認已選定" 故障轉移群集管理" ,然后在" 管理" 下面,單擊" 創(chuàng)建群集" 。
3. 按照向導中的說明指定:
- 要在群集中包括的服務器。
- 群集的名稱。
- 您的 DHCP 設置未自動提供的 IP 地址信息。
4. 在向導運行并且" 摘要" 頁出現(xiàn)時,如果要查看向導所執(zhí)行任務的報告,請單擊" 查看報告" 。
若要在關閉向導后查看報告,請查看以下文件夾,其中 SystemRoot 是操作系統(tǒng)的位置(例如,C:Windows):
SystemRootClusterReports
小提示:要打開" 故障轉移群集" 管理單元,請依次單擊" 開始" 、" 管理工具" ,然后單擊" 故障轉移群集管理" 。 如果出現(xiàn)" 用戶賬戶控制" 對話框,請確認所顯示的是您想要執(zhí)行的操作,然后單擊" 繼續(xù)" 。
將服務器添加到故障轉移群集
1. 確認已經(jīng)將網(wǎng)絡和存儲連接到要添加的服務器。
2. 驗證硬件配置,包括現(xiàn)有的群集節(jié)點和建議的新節(jié)點。
重要:僅當完整配置(服務器、網(wǎng)絡和存儲)可以通過" 驗證配置" 向導中的所有測試時,Microsoft 才支持故障轉移群集解決方案。另外,解決方案中的所有硬件組件均必須標記為"Certified for Windows Server 2008"。
3. 如果故障轉移群集管理管理單元中沒有顯示要配置的群集,請右鍵單擊控制臺樹中的" 故障轉移群集管理" ,單擊" 管理群集" ,然后選擇或指定需要的群集。
,4. 選擇群集,然后在" 操作" 窗格中,單擊" 添加節(jié)點" 。
5. 按照向導中的說明指定要添加到群集的服務器。
6. 在向導運行并且" 摘要" 頁出現(xiàn)時,如果要查看向導所執(zhí)行任務的報告,請單擊" 查看報告" 。
四、仲裁配置
故障轉移群集中的仲裁配置確定群集允許的故障數(shù)。如果出現(xiàn)更多故障,則群集必須停止運行。
仲裁的意義
在出現(xiàn)網(wǎng)絡問題時,仲裁可以干預群集節(jié)點之間的通信。一小組節(jié)點可能在網(wǎng)絡的一個功能部分中間相互通信,但是無法與網(wǎng)絡另一部分中不同的一組節(jié)點進行通信。這可能導致嚴重問題。在這種" 分隔" 情況下,至少有一組節(jié)點必須停止作為群集運行。
為防止群集中的分隔所引起的問題,群集軟件要求作為群集運行的任何節(jié)點集必須使用投票算法確定該節(jié)點集在指定時間是否有仲裁。由于指定群集包含特定的一組節(jié)點和一個特定的仲裁配置,群集將知道多少" 投票" 會構成多數(shù)(即,一次仲裁)。如果投票數(shù)低于多數(shù),群集就停止運行。節(jié)點仍將偵聽其他節(jié)點的存在,當另一個節(jié)點在網(wǎng)絡上重新出現(xiàn)時,節(jié)點不會開始作為一個群集運行,直到重新獲得仲裁。
例如,在使用" 節(jié)點多數(shù)" 的五節(jié)點群集中,請考慮如果節(jié)點 1、2 和 3 可以相互通信,而不能與節(jié)點 4 和 5 通信,會發(fā)生什么情況。節(jié)點 1、2、3 構成多數(shù),它們繼續(xù)作為群集運行。節(jié)點 4 和 5 占少數(shù),停止作為群集運行。如果節(jié)點 3 失去與其他節(jié)點的通信,則所有節(jié)點停止作為群集運行。但是,所有運行的節(jié)點都將繼續(xù)偵聽通信,以便在網(wǎng)絡重新開始工作時,群集能夠組成并開始運行。
請注意,群集的整個功能不只是取決于仲裁,還取決于每個節(jié)點上用來支持故障轉移到該節(jié)點的服務和應用程序的容量。例如,包含五個節(jié)點的群集在兩個節(jié)點出現(xiàn)故障后仍然擁有仲裁,但是只有每個剩余的群集節(jié)點擁有足夠容量來支持故障轉移到它的服務和應用程序時,它才會繼續(xù)服務客戶端。
(一)仲裁配置選項
可以從四個可能的仲裁配置中選擇:
- 節(jié)點多數(shù)(推薦用于含有奇數(shù)個節(jié)點的群集)
,可以承受的故障節(jié)點數(shù)為節(jié)點數(shù)的一半(四舍五入)減去一。例如,七個節(jié)點的群集可以承受三個節(jié)點出現(xiàn)故障。
- 節(jié)點和磁盤多數(shù)(推薦用于含有偶數(shù)個節(jié)點的群集)
在見證磁盤保持聯(lián)機時可以承受的故障節(jié)點數(shù)為節(jié)點數(shù)的一半(四舍五入)。例如,在見證磁盤聯(lián)機時,六個節(jié)點的群集可以承受有三個節(jié)點出現(xiàn)故障。
在見證磁盤脫機或出現(xiàn)故障時可以承受的故障節(jié)點數(shù)為節(jié)點數(shù)的一半(四舍五入)減去一。例如,見證磁盤有故障的六個節(jié)點的群集可以承受兩 (3-1=2) 個節(jié)點故障。
- 節(jié)點和文件共享多數(shù)(適合有特殊配置的群集)
與" 節(jié)點和磁盤多數(shù)" 的工作方式類似,但是此群集使用見證文件共享,而不是見證磁盤。
請注意,如果使用" 節(jié)點和文件共享多數(shù)" ,則至少必須有一個可用的群集節(jié)點包含群集配置的最新副本,然后才能啟動群集。否則,您必須通過特定節(jié)點來強制啟動群集。
- 無多數(shù):僅磁盤(不推薦)
可以承受除一個節(jié)點外的所有節(jié)點出現(xiàn)故障(如果磁盤聯(lián)機)但是,建議不使用此配置,因為磁盤可能成為單一故障點。
二)仲裁配置圖例
如下圖說明三種仲裁配置的工作方式。第四種配置只是用文字進行了描述,因為它與" 節(jié)點和磁盤多數(shù)" 配置插圖類似。
注:在插圖中,對于" 僅磁盤" 之外的所有配置,注意大多數(shù)相關元素是否都在通信(與元數(shù)數(shù)量無關)。當它們在通信時,群集繼續(xù)工作。當它們不再通信時,群集停止運行。(圖1)
,
節(jié)點多數(shù)仲裁配置,三個節(jié)點

如前面的插圖所示,在使用" 節(jié)點多數(shù)" 配置的群集中,在計算多數(shù)時僅統(tǒng)計節(jié)點。(圖2)
節(jié)點和磁盤多數(shù)仲裁配置,四個節(jié)點(加磁盤)
如前面的插圖所示,在使用" 節(jié)點和磁盤多數(shù)" 配置的群集中,在計算多數(shù)時統(tǒng)計節(jié)點和見證磁盤。
節(jié)點和文件共享多數(shù)仲裁配置
在使用" 節(jié)點和文件共享多數(shù)" 配置的群集中,在計算多數(shù)時統(tǒng)計節(jié)點和見證文件共享。這與前面插圖中所示的" 節(jié)點和磁盤多數(shù)" 仲裁配置類似,只不過見證是群集中所有節(jié)點可以訪問的文件共享,而不是群集存儲中的磁盤。(圖3)
,
無多數(shù)(僅磁盤)仲裁配置,三個節(jié)點
在使用" 僅磁盤" 配置的群集中,節(jié)點數(shù)不影響如何實現(xiàn)仲裁。磁盤就是仲裁。但是,如果失去與磁盤的通信,群集將變得不可用。
(三)選擇群集的仲裁選項
1. 如果故障轉移群集管理管理單元中沒有顯示要配置的群集,請右鍵單擊控制臺樹中的" 故障轉移群集管理" ,單擊" 管理群集" ,然后選擇或指定需要的群集。
2. 在選定了群集時,在" 操作" 窗格中,單擊" 更多操作" ,然后單擊" 配置群集仲裁設置" 。
3. 按照向導中的說明選擇群集的仲裁配置。如果選擇包括見證磁盤或見證文件共享的配置,請按照指定見證的說明進行操作。
4. 在向導運行并且" 摘要" 頁出現(xiàn)時,如果要查看向導所執(zhí)行任務的報告,請單擊" 查看報告" 。
五、管理
當創(chuàng)建了故障轉移集群后,免不了要對其進行這樣或那樣的操作。因此,對其正確管理就顯得異常重要。本文則重點分享有關故障轉移集群的典型管理操作。
(一)使群集服務或應用程序聯(lián)機或脫機
在維護或診斷過程中有時候會涉及故障轉移群集中的服務或應用程序,您可能需要使該服務或應用程序聯(lián)機或脫機。雖然群集服務會以有序方式處理該過程,使應用程序聯(lián)機或脫機并不會觸發(fā)故障轉移。例如,如果特定的群集應用程序需要特定磁盤,群集服務將確保在應用程序啟動之前該磁盤可用。具體步驟如下:
,A 、使用 Windows 界面使群集服務或應用程序聯(lián)機或脫機
1. 在" 故障轉移群集管理" 管理單元中,如果要管理的群集未顯示,則在控制臺樹中,右鍵單擊" 故障轉移群集管理" ,再單擊" 管理群集" ,然后選擇或指定您需要的群集。
2. 如果控制臺樹已折疊,則在要管理的群集下面展開控制臺樹。
3. 在" 服務和應用程序" 下面,展開控制臺樹。
4. 通過單擊服務或應用程序,查看中心窗格中的" 狀態(tài)" 列,檢查您要使其聯(lián)機或脫機的服務或應用程序的狀態(tài)。
5. 右鍵單擊要使其聯(lián)機或脫機的服務或應用程序。
6. 單擊相應的命令:" 使此服務或應用程序聯(lián)機" 或" 使此服務或應用程序脫機" 。
B 、使用命令提示符窗口使群集服務或應用程序聯(lián)機或脫機
1. 若要打開命令提示符窗口,請單擊" 開始" ,再右鍵單擊" 命令提示符" ,然后單擊" 以管理員身份運行" 或單擊" 打開" 。
2. 如果出現(xiàn)" 用戶賬戶控制" 對話框,請確認所顯示的是您想要執(zhí)行的操作,然后單擊" 繼續(xù)" 。
3. 通過鍵入下列命令檢查群集服務和應用程序的狀態(tài):
CLUSTER [cluster-name] GROUP /STATUS
4. 鍵入以下命令之一:
- 若要使群集服務或應用程序聯(lián)機,請鍵入:
CLUSTER [cluster-name] GROUP "service-or-application name" /ON[:node-name]
[/WAIT[:timeout-seconds]]
- 若要使群集服務或應用程序脫機,請鍵入:
CLUSTER [cluster-name] GROUP "service-or-application name" /ON[:node-name]
[/WAIT[:timeout-seconds]]
(二)暫?;蚧謴凸收限D移群集中的節(jié)點
在暫停一個節(jié)點時,現(xiàn)有組和資源可以保持聯(lián)機,但是該節(jié)點上的其他組和資源不能聯(lián)機。通常暫停一個節(jié)點是為了對該節(jié)點應用軟件更新。如果需要在一個群集節(jié)點上執(zhí)行