Prism Central 備份和還原 Part 1 | Nutanix



簡介

在 Nutanix 超融合基礎架構中,Prism Central(PC)主要擔任集中式主控台的角色,針對 Nutanix 超融合叢集中資源管理和調度的工作任務。一般來說,當小型企業或組織部署 Nutanix 超融合叢集時,由於運作規模不大,或許可以在不使用 PC 主控台情況下,僅依靠 Nutanix 超融合叢集中預設的 Prism Element(PE),即可完成大部份的維護管理工作任務。

然而,中大型企業或組織,由於各項營運服務和專案不斷增強,勢必會部署多個 Nutanix 超融合叢集,此時便需要部署 PC 主控台,以便同時管理和調度多個 Nutanix 超融合叢集資源。因此,在本文中,將說明及實作演練,如何依靠內建的 Prism Central Backup and Restore(PCBR)機制,針對 PC 主控台進行備份和還原的動作。

值得注意的是,在 Nutanix 官方文件中有特別提醒,企業及組織應使用內建的 PCBR 機制,進行 PC 主控台的備份還原作業,不支援使用第三方備份軟體,例如,HYCU、Veeam……等,或是採用 Nutanix Protection Domains 機制,來試圖備份或還原 PC 主控台,若然將會導致 PC 主控台在還原後,出現資料不一致的錯誤或無法正確還原的情況。





PC 主控台災難復原情境

事實上,一旦 PC 主控台遭遇災難或故障損壞情況時,Nutanix 超融合叢集中,VM 虛擬主機或容器及微服務……等營運工作負載,皆不受影響能夠繼續正常運作,然而失去 PC 主控台後,管理人員便會立即面臨,無法即時管理和調度多個 Nutanix 超融合叢集資源的困境。

在災難情境方面,有各式各樣的情況會產生災難,例如,企業或組織遭受惡意攻擊、安全漏洞未即時更新遭遇攻擊、網路環境發生故障、電力供應發生故障、自然災難導致資料中心受損……等,這些災難發生時都有可能導致 PC 主控台故障(如圖所示)。

圖、PC 主控台遭受不同層級的災難導致故障的情況示意圖

針對 PC 主控台高可用性方面,支援兩種不同的解決方案,分別是「水平擴充 PC」(Scale-Out Prism Central),以及「PC VM HA 高可用性」(Prism Central VM hosting node High Availability)。在水平擴充 PC 主控台方案中,簡單來說,就是將 PC 主控台的 VM 虛擬主機,由原本單台 VM 虛擬主機運作的方式,水平擴充成「3 台」PC 主控台 VM 虛擬主機規模(如圖所示)。

圖、單台 PC 主控台和水平擴充成 3 台 PC 主控台架構示意圖

一旦水平擴充 PC 主控台架構成形後,當其中一台 PC 主控台 VM 虛擬主機,在遭遇災難事件而受損無法運作時,系統將會自動在叢集中,其它仍然存活的 AHV 成員節點中,自動重新產生一台 PC 主控台 VM 虛擬主機。

此外,倘若企業和組織,在一開始部署 PC 主控台時,即便選擇單台 PC 主控台運作規模,管理人員在後續的 PC 主控台操作介面中(如圖所示),也可以很容易進行水平擴充的工作任務,請依序點選「Infrastructure > Settings > Prism Central Management > Scale Out PC」,在彈出的 Scale Out PC 視窗中,填入第二台和第三台 PC 主控台 VM 虛擬主機名稱和 IP 位址後,按下 Expand 鈕,系統便會自動進行 PC 主控台水平擴充工作任務。

圖、將單台 PC 主控台運作規模水平擴充成三台 PC 主控台操作示意圖

另一項 PC VM HA 高可用性方案,一旦 PC 主控台所處底層的 AHV 節點主機,發生嚴重災難事件而無法運作時,系統將會把受影響的 PC 主控台,在叢集中自動挑選一台仍然存活的 AHV 成員節點主機,自動將 PC 主控台 VM 虛擬主機重新啟動(如圖所示)。

圖、Nutanix VM High Availability 高可用性機制運作架構示意圖