︿
Top


簡介

之前,Nutanix University 推出新的線上免費課程,共有下列四堂全新線上免費課程,非常實用,有興趣的朋友參考看看。





GPU Features on Nutanix AHV

在 Nutanix AHV 平台上,GPU 支援功能持續進化,為各種工作負載提供更高的彈性與效能。首先,AHV 透過簡化 GPU 組態設定與支援 NVIDIA vGPU 軟體版本,讓使用者能夠以更低的預算成本享受多重 vGPU 的彈性,並支援 GPU 加速 VM 虛擬主機 Live Migration,讓版本升級和日常維護不在是難題。



AHV 虛擬化平台,也增強在虛擬化環境中支援 OpenGL、WebGL 與 DirectX 等圖形 API,進一步強化圖形應用的相容性,並且 Nutanix 提供 AHV 相容的 NVIDIA Host Driver 與 vGPU Guest OS Driver,確保安裝 Windows 11 與 Windows Server 2025 等作業系統的 VM 虛擬主機,在最新版本中能穩定運作,並針對 AMD CPU 平台提供相容性。






GPU Pass Through

在 Nutanix 運作環境中,支援多種運作模式,其中 AHV 支援 GPU Pass-Through,讓 VM 虛擬主機上的應用程式能夠直接存取 GPU 資源,這種運作模式特別適合需要完整 GPU 效能的工作負載,例如,高階運算或特定圖形渲染。

透過 Nutanix 管理介面,管理人員可以在叢集層級檢視所有 GPU 資源,並將可用的 GPU 分配給 VM 虛擬主機:
  • 單台 VM 虛擬主機,可以分配多顆 GPU(最多支援 4 顆 Pass-Through GPU)。
  • 在 Pass-Through 組態設定模式下,同一時間某顆 GPU 資源,只能被一台 VM 虛擬主機使用。

AHV 支援 GPU 以 Graphics Mode 或 Compute Mode 運行:
  • Graphics Mode: 預設模式,適合圖形渲染。
  • Compute Mode: 適合運算工作負載,介面會在 GPU 型號後加上 .compute 字串。

當管理人員需要針對 VM 虛擬主機,進行 GPU 模式切換時,請依照以下操作步驟:
  • 將主機設為 Maintenance Mode。
  • 登入 AHV 主機,依照 GPU 廠商提供的 Linux VM 標準程序,手動更新 GPU Firmware 版本。
  • 重新啟動主機。
  • 在 Prism 重新配置 GPU,並啟動 VM,例如,將 NVIDIA Tesla M60 從 Graphics Mode 切換至 Compute Mode,重新啟動後,Prism 會顯示為 NVIDIA Tesla M60.compute,此時需重新將 GPU 加回 VM。



值得注意的是,GPU Pass-Through 運作模式,雖然能夠提供完整 GPU 效能,但有下列限制:
  • 不支援 Live Migration,在 BIOS、BMC 或 Hypervisor 升級時,VM 會被關閉並在主機恢復後自動重新啟動。
  • 不支援 VM Pause/Resume。
  • 不支援 GPU Hot Add/Remove。
  • 僅能在 VM Power Off 時修改 GPU 組態設定。
  • Prism Web Console 無法存取已經配置 vGPU Driver 的 VM,需要事先設定替代存取方式,例如,RDP,在移除 GPU Pass-Through 後,Prism Console 存取功能才會恢復。





vGPU and Live Migration

在 GPU 資源分配的設計上,Passthrough 模式適合用於少量,但需要高 GPU 資源的 VM 虛擬主機。然而,對於 VDI 工作負載而言,使用情境就不完全相同了,因為在 VDI 環境中,通常包含大量的 VM 虛擬主機,並且每一台 VM 虛擬主機的 GPU 資源需求,會因為應用程式類型與使用情境而有所不同,簡單來說,在 VDI 環境中就是適合採用 vGPU 的情況。


目前, NVIDIA GRID GPU 卡,每一張 PCI 實體卡中包含 1 ~ 4 顆 GPU,而每台實體主機可安裝 1 至 2 張 GPU 卡,這代表單台節點主機最多可配置 8 顆 GPU,以滿足 VDI 工作負載的高密度需求。此外,為了提供更高的彈性,vGPU 模式允許將每顆 GPU 切割成更小的資源片段,並分配給不同的 VM 虛擬主機,以便讓管理人員能夠依照應用程式需求,更準確的分配 GPU 資源。


在日常維運中,版本升級與故障排除的效率至關重要,在 AHV 運作環境中,支援 vGPU 指派的 VM Live Migration 機制,讓管理人員能夠在不中斷營運服務的情況下,順利完成日常維護作業。






Adding Multiple vGPUs

對於一般 VDI 工作負載,單一 vGPU Profile 便能因應大多數應用程式的工作負載,然而在少數特殊情境下,例如:
  • CAD/CAE 工程設計
  • 影像渲染與視覺特效
  • AI/ML 訓練與推論
此時,VM 虛擬主機便需要額外的 GPU 資源,在 Nutanix 運作環境中透過多重 vGPU 支援機制,即可在同一台 VM 虛擬主機上配置多個 vGPU,確保效能需求被滿足。


值得注意的是,在開始組態設定之前,請確認已經滿足下列條件,確保多重 vGPU 功能在 AHV 環境中正確運作:
  • 已採用 NVIDIA Virtual GPU 軟體版本 10.1 (440.53) 或更新版本的授權。
  • 已遵循 Multiple vGPU Support 相關的指引與限制。

文章標籤: