logo
Casi
dettagli della soluzione
Casa > Casi >
Distribuzione di infrastrutture di High-Performance Computing per un'impresa russa leader
Eventi
Contattici
86--13552664309
Contatta ora

Distribuzione di infrastrutture di High-Performance Computing per un'impresa russa leader

2026-04-20

Ultimo caso aziendale su Distribuzione di infrastrutture di High-Performance Computing per un'impresa russa leader
Visualizzazione del cliente

A prominent Russian enterprise specializing in artificial intelligence research and data-intensive applications sought to establish a cutting-edge computing infrastructure to support their growing computational demandsL'organizzazione richiedeva una soluzione scalabile e ad alte prestazioni in grado di gestire complessi carichi di lavoro di deep learning mantenendo robuste capacità di archiviazione dei dati.

Sfide del progetto
  • Richieste di calcolo: Necessità di una potenza di elaborazione accelerata da GPU significativa per l'addestramento e l'inferenza del modello AI/ML
  • Requisiti di conservazione: Soluzione di archiviazione ad alta capacità e prestazioni per set di dati di grandi dimensioni
  • Scalabilità: Le infrastrutture devono supportare l'espansione futura senza importanti modifiche architettoniche
  • Affidabilità: operazioni mission-critical che richiedono hardware di livello enterprise con tempi di fermo minimo
  • Complessità dell'integrazione: Integrazione senza soluzione di continuità tra i livelli di calcolo e di archiviazione su più piattaforme hardware
Architettura delle soluzioni

Il nostro team ha progettato e implementato una soluzione infrastrutturale a livelli distribuita in due fasi strategiche, garantendo prestazioni ottimali mantenendo la continuità operativa durante l'implementazione.

Fase 1: Impiego dell'infrastruttura di calcolo

Timeline: La distribuzione iniziale si è concentrata sull'istituzione delle basi computazionali

Configurazione hardware:

  • 10 server Dell PowerEdge R750 (configurazione 12LFF)
    • Processori Intel Xeon scalabili (completamente configurati)
    • 1.5TB di RAM DDR4 ECC per server
    • SSD NVMe da 12 x 3,84 TB in configurazione RAID
    • Accelerazione della GPU: 2 x NVIDIA Tesla V100 32GB (Turbo) GPU per server
    • Capacità totale della GPU: 20 GPU NVIDIA V100 che forniscono 640 GB di memoria ad alta larghezza di banda
    • Rete 10GbE con connessioni ridondanti
    • Sistemi di alimentazione e raffreddamento per imprese
  • 3 x Inspur NF5468M6 AI Server (Inspur YuanNao Platform)
    • Ottimizzato specificamente per carichi di lavoro di apprendimento profondo
    • Processori Intel Xeon doppi con funzionalità di accelerazione AI
    • 768 GB di RAM DDR4 per server
    • 8 x GPU NVIDIA A100 Tensor Core (o acceleratori AI ad alte prestazioni equivalenti)
    • Cache di memorizzazione NVMe per l'accelerazione dell'addestramento del modello
    • Rete 25GbE per interconnettività ad alta velocità
Fase 2: Attuazione dello storage aziendale

Timeline: Impiego successivo per completare l'infrastruttura completa

Configurazione hardware:

  • 10 x Dell PowerVault ME5024 iSCSI Storage Array
    • Configurazione attiva-attiva a doppio controller per una massima disponibilità
    • Capacità di stoccaggio: 24 x 7,68TB di SSD SAS per array (184,32TB di capacità grezza per array)
    • Capacità totale di stoccaggio delle materie prime: 1,843.2TB su tutte le matrici
    • Protezione RAID avanzata (RAID 6/60) con unità di riserva calde
    • Opzioni di connettività 16Gb Fibre Channel e 10Gb iSCSI
    • Tiering automatico tra cache SSD e HDD ad alta capacità
    • Funzioni integrate di deduplicazione e compressione dei dati
    • Software di gestione di livello aziendale con analisi predittiva
Punti salienti dell'integrazione tecnica
  • Piattaforma di gestione unica: Dell OpenManage e Inspur Integrazione ISPIM per il monitoraggio e l'amministrazione centralizzati
  • Interconnessione ad alta velocità: 25GbE backbone network che collega i nodi di calcolo alle matrici di memorizzazione
  • Virtualizzazione dello storage: VMware vSAN e Dell PowerStore software-defined storage integrazione
  • Pooling delle risorse GPU: NVIDIA GPU Direct RDMA per una comunicazione ottimizzata tra GPU e GPU
  • Assistenza e recupero in caso di catastrofe: Strategia globale di protezione dei dati con replicazione esterna
Impatto sulle imprese
  • Miglioramento delle prestazioni: aumento del 400% del volume di formazione dei modelli di IA rispetto alle infrastrutture precedenti
  • Efficienza di stoccaggio: riduzione del 60% della latenza di stoccaggio mantenendo al contempo elevati requisiti di capacità
  • Continuità operativa: 99,999% di disponibilità ottenuta grazie alla progettazione di un'architettura ridondante
  • Scalabilità: Infrastrutture progettate per scalare fino a 3 volte la capacità attuale senza modifiche architettoniche
  • Costo totale di proprietà: riduzione del 35% del TCO a 3 anni grazie a una selezione ottimizzata dell'hardware e all'efficienza energetica
Timeline e esecuzione del progetto
  • Fase di pianificazione: 4 settimane di analisi dettagliata dei requisiti e progettazione di architetture
  • Fase 1 Consegna: 6 settimane per l'implementazione e la convalida dell'infrastruttura di calcolo
  • Fase 2 consegna: 8 settimane per l'implementazione dello stoccaggio e le prove di integrazione
  • Test di accettazione da parte dell'utente: 2 settimane di validazione completa delle prestazioni
  • Durata totale del progetto: 20 settimane dalla firma del contratto al pieno avvio della produzione
Testimonianza del cliente

"La soluzione infrastrutturale fornita da questo partner ha trasformato le nostre capacità di ricerca sull'IA.combinato con la robusta soluzione di storage Dell, ci ha fornito una base che non solo soddisfa le nostre esigenze attuali, ma ci posiziona per la crescita futura.L'approccio di distribuzione graduale ha ridotto al minimo le interruzioni aziendali assicurandoci la potenza di calcolo necessaria quando ne avevamo bisogno. "

CTO, grande impresa russa

Mappa stradale per il futuro
  • Ottimizzazione del carico di lavoro: Accelerazione della GPU aggiuntiva per specifici framework di apprendimento profondo
  • Espansione del magazzino: Aumento previsto della capacità a 5PB con l'attuazione di NVMe-oF
  • Integrazione dell'Edge Computing: Estensione dell'infrastruttura per supportare carichi di lavoro di IA distribuiti
  • Integrazione con il cloud: Strategia di cloud ibrido che sfrutta gli investimenti in loco esistenti

Questo caso di studio dimostra la nostra capacità di fornire soluzioni infrastrutturali complesse e multivenditore che affrontano le sfide del mondo reale fornendo al contempo un ROI chiaro e misurabile.Il nostro approccio di distribuzione graduale garantisce un minimo di interruzioni aziendali massimizzando l'efficienza operativa e la scalabilità futura.

Nota: i dettagli specifici del cliente e le metriche di prestazione possono essere adeguati in base agli accordi di riservatezza e ai risultati effettivi misurati.