簡介
之前,Nutanix University 推出新的線上免費課程,共有下列四堂全新線上免費課程,非常實用,有興趣的朋友參考看看。
GPU Features on Nutanix AHV
在 Nutanix AHV 平台上,GPU 支援功能持續進化,為各種工作負載提供更高的彈性與效能。首先,AHV 透過簡化 GPU 組態設定與支援 NVIDIA vGPU 軟體版本,讓使用者能夠以更低的預算成本享受多重 vGPU 的彈性,並支援 GPU 加速 VM 虛擬主機 Live Migration,讓版本升級和日常維護不在是難題。
GPU Pass Through
在 Nutanix 運作環境中,支援多種運作模式,其中 AHV 支援 GPU Pass-Through,讓 VM 虛擬主機上的應用程式能夠直接存取 GPU 資源,這種運作模式特別適合需要完整 GPU 效能的工作負載,例如,高階運算或特定圖形渲染。
透過 Nutanix 管理介面,管理人員可以在叢集層級檢視所有 GPU 資源,並將可用的 GPU 分配給 VM 虛擬主機:
- 單台 VM 虛擬主機,可以分配多顆 GPU(最多支援 4 顆 Pass-Through GPU)。
- 在 Pass-Through 組態設定模式下,同一時間某顆 GPU 資源,只能被一台 VM 虛擬主機使用。
AHV 支援 GPU 以 Graphics Mode 或 Compute Mode 運行:
- Graphics Mode: 預設模式,適合圖形渲染。
- Compute Mode: 適合運算工作負載,介面會在 GPU 型號後加上 .compute 字串。
當管理人員需要針對 VM 虛擬主機,進行 GPU 模式切換時,請依照以下操作步驟:
- 將主機設為 Maintenance Mode。
- 登入 AHV 主機,依照 GPU 廠商提供的 Linux VM 標準程序,手動更新 GPU Firmware 版本。
- 重新啟動主機。
- 在 Prism 重新配置 GPU,並啟動 VM,例如,將 NVIDIA Tesla M60 從 Graphics Mode 切換至 Compute Mode,重新啟動後,Prism 會顯示為 NVIDIA Tesla M60.compute,此時需重新將 GPU 加回 VM。
值得注意的是,GPU Pass-Through 運作模式,雖然能夠提供完整 GPU 效能,但有下列限制:
- 不支援 Live Migration,在 BIOS、BMC 或 Hypervisor 升級時,VM 會被關閉並在主機恢復後自動重新啟動。
- 不支援 VM Pause/Resume。
- 不支援 GPU Hot Add/Remove。
- 僅能在 VM Power Off 時修改 GPU 組態設定。
- Prism Web Console 無法存取已經配置 vGPU Driver 的 VM,需要事先設定替代存取方式,例如,RDP,在移除 GPU Pass-Through 後,Prism Console 存取功能才會恢復。
vGPU and Live Migration
在 GPU 資源分配的設計上,Passthrough 模式適合用於少量,但需要高 GPU 資源的 VM 虛擬主機。然而,對於 VDI 工作負載而言,使用情境就不完全相同了,因為在 VDI 環境中,通常包含大量的 VM 虛擬主機,並且每一台 VM 虛擬主機的 GPU 資源需求,會因為應用程式類型與使用情境而有所不同,簡單來說,在 VDI 環境中就是適合採用 vGPU 的情況。
在日常維運中,版本升級與故障排除的效率至關重要,在 AHV 運作環境中,支援 vGPU 指派的 VM Live Migration 機制,讓管理人員能夠在不中斷營運服務的情況下,順利完成日常維護作業。
Adding Multiple vGPUs
對於一般 VDI 工作負載,單一 vGPU Profile 便能因應大多數應用程式的工作負載,然而在少數特殊情境下,例如:
- CAD/CAE 工程設計
- 影像渲染與視覺特效
- AI/ML 訓練與推論
此時,VM 虛擬主機便需要額外的 GPU 資源,在 Nutanix 運作環境中透過多重 vGPU 支援機制,即可在同一台 VM 虛擬主機上配置多個 vGPU,確保效能需求被滿足。
值得注意的是,在開始組態設定之前,請確認已經滿足下列條件,確保多重 vGPU 功能在 AHV 環境中正確運作:
- 已採用 NVIDIA Virtual GPU 軟體版本 10.1 (440.53) 或更新版本的授權。
- 已遵循 Multiple vGPU Support 相關的指引與限制。












