Vai al contenuto

Ottimizzazione dei carichi di lavoro AI con GPU e Cluster VM tramite DDA

Come l’assegnazione diretta delle GPU alle VM nei cluster di failover massimizza le prestazioni.

Nel panorama in continua evoluzione dell’intelligenza artificiale (AI), la necessità di risorse di calcolo più potenti ed efficienti è sempre crescente. Microsoft è in prima linea in questa rivoluzione tecnologica, offrendo agli utenti la possibilità di sfruttare tutto il potenziale dei loro carichi di lavoro AI grazie alle GPU (Graphics Processing Unit). La virtualizzazione delle GPU permette di elaborare ingenti quantità di dati in modo rapido ed efficiente. L’uso delle GPU con VM (Virtual Machine) clusterizzate tramite DDA (Discrete Device Assignment) diventa particolarmente rilevante nei cluster di failover, offrendo un accesso diretto alla GPU.

Utilizzare le GPU con VM clusterizzate attraverso DDA consente di assegnare una o più GPU fisiche intere a una singola VM. DDA permette alle VM di avere un accesso diretto alle GPU fisiche, riducendo la latenza e sfruttando appieno le capacità della GPU, essenziale per compiti che richiedono molte risorse di calcolo.

Vantaggi dell’Utilizzo delle GPU nei Cluster di Failover

L’uso delle GPU con VM clusterizzate consente di eseguire carichi di lavoro ad alta intensità di calcolo all’interno di un cluster di failover. Un cluster di failover è un gruppo di nodi indipendenti che lavorano insieme per aumentare la disponibilità dei ruoli clusterizzati. Se uno o più nodi del cluster dovessero guastarsi, gli altri nodi continuerebbero a fornire il servizio, garantendo un’elevata disponibilità grazie ai cluster di failover. Integrando le GPU con le VM clusterizzate, questi cluster possono ora supportare carichi di lavoro ad alta intensità di calcolo sulle VM. I cluster di failover utilizzano pool di GPU, che sono gestiti dal cluster stesso. Un amministratore crea questi pool di GPU e dichiara le esigenze GPU delle VM. I pool sono creati su ciascun nodo con lo stesso nome. Una volta aggiunte le GPU e le VM ai pool, il cluster gestisce quindi il posizionamento delle VM e l’assegnazione delle GPU.

Requisiti e Compatibilità

Per utilizzare le GPU con le VM clusterizzate tramite DDA, è necessario disporre di un cluster di failover che operi su Windows Server 2025 Datacenter e garantire che il livello funzionale del cluster sia al livello di Windows Server 2025. Ogni nodo del cluster deve avere la stessa configurazione e le stesse GPU per abilitare le GPU con le VM clusterizzate per la funzionalità del cluster di failover. Attualmente, DDA non supporta la migrazione live e non è supportata da tutte le GPU. Per verificare se la tua GPU è compatibile con DDA, contatta il produttore della tua GPU e assicurati di rispettare le linee guida di configurazione fornite, che includono l’installazione dei driver specifici del produttore su ciascun server del cluster e l’ottenimento della licenza specifica ove applicabile.

L’uso delle GPU con VM clusterizzate tramite DDA sarà disponibile in Windows Server 2025 Datacenter e inizialmente è stato abilitato in Azure Stack HCI 22H2.