dettagli della soluzione

Casa > Casi >

Distribuzione di infrastrutture di High-Performance Computing per un'impresa russa leader

Eventi

Casi

Contattici

lydia@bjlxmt.cn

86--13552664309

Contatta ora

Distribuzione di infrastrutture di High-Performance Computing per un'impresa russa leader

2026-04-20

Visualizzazione del cliente

A prominent Russian enterprise specializing in artificial intelligence research and data-intensive applications sought to establish a cutting-edge computing infrastructure to support their growing computational demandsL'organizzazione richiedeva una soluzione scalabile e ad alte prestazioni in grado di gestire complessi carichi di lavoro di deep learning mantenendo robuste capacità di archiviazione dei dati.

Sfide del progetto

Richieste di calcolo: Necessità di una potenza di elaborazione accelerata da GPU significativa per l'addestramento e l'inferenza del modello AI/ML
Requisiti di conservazione: Soluzione di archiviazione ad alta capacità e prestazioni per set di dati di grandi dimensioni
Scalabilità: Le infrastrutture devono supportare l'espansione futura senza importanti modifiche architettoniche
Affidabilità: operazioni mission-critical che richiedono hardware di livello enterprise con tempi di fermo minimo
Complessità dell'integrazione: Integrazione senza soluzione di continuità tra i livelli di calcolo e di archiviazione su più piattaforme hardware

Architettura delle soluzioni

Il nostro team ha progettato e implementato una soluzione infrastrutturale a livelli distribuita in due fasi strategiche, garantendo prestazioni ottimali mantenendo la continuità operativa durante l'implementazione.

Fase 1: Impiego dell'infrastruttura di calcolo

Timeline: La distribuzione iniziale si è concentrata sull'istituzione delle basi computazionali

Configurazione hardware:

10 server Dell PowerEdge R750 (configurazione 12LFF)
- Processori Intel Xeon scalabili (completamente configurati)
- 1.5TB di RAM DDR4 ECC per server
- SSD NVMe da 12 x 3,84 TB in configurazione RAID
- Accelerazione della GPU: 2 x NVIDIA Tesla V100 32GB (Turbo) GPU per server
- Capacità totale della GPU: 20 GPU NVIDIA V100 che forniscono 640 GB di memoria ad alta larghezza di banda
- Rete 10GbE con connessioni ridondanti
- Sistemi di alimentazione e raffreddamento per imprese
3 x Inspur NF5468M6 AI Server (Inspur YuanNao Platform)
- Ottimizzato specificamente per carichi di lavoro di apprendimento profondo
- Processori Intel Xeon doppi con funzionalità di accelerazione AI
- 768 GB di RAM DDR4 per server
- 8 x GPU NVIDIA A100 Tensor Core (o acceleratori AI ad alte prestazioni equivalenti)
- Cache di memorizzazione NVMe per l'accelerazione dell'addestramento del modello
- Rete 25GbE per interconnettività ad alta velocità

Fase 2: Attuazione dello storage aziendale

Timeline: Impiego successivo per completare l'infrastruttura completa

Configurazione hardware:

10 x Dell PowerVault ME5024 iSCSI Storage Array
- Configurazione attiva-attiva a doppio controller per una massima disponibilità
- Capacità di stoccaggio: 24 x 7,68TB di SSD SAS per array (184,32TB di capacità grezza per array)
- Capacità totale di stoccaggio delle materie prime: 1,843.2TB su tutte le matrici
- Protezione RAID avanzata (RAID 6/60) con unità di riserva calde
- Opzioni di connettività 16Gb Fibre Channel e 10Gb iSCSI
- Tiering automatico tra cache SSD e HDD ad alta capacità
- Funzioni integrate di deduplicazione e compressione dei dati
- Software di gestione di livello aziendale con analisi predittiva

Punti salienti dell'integrazione tecnica

Piattaforma di gestione unica: Dell OpenManage e Inspur Integrazione ISPIM per il monitoraggio e l'amministrazione centralizzati
Interconnessione ad alta velocità: 25GbE backbone network che collega i nodi di calcolo alle matrici di memorizzazione
Virtualizzazione dello storage: VMware vSAN e Dell PowerStore software-defined storage integrazione
Pooling delle risorse GPU: NVIDIA GPU Direct RDMA per una comunicazione ottimizzata tra GPU e GPU
Assistenza e recupero in caso di catastrofe: Strategia globale di protezione dei dati con replicazione esterna

Impatto sulle imprese

Miglioramento delle prestazioni: aumento del 400% del volume di formazione dei modelli di IA rispetto alle infrastrutture precedenti
Efficienza di stoccaggio: riduzione del 60% della latenza di stoccaggio mantenendo al contempo elevati requisiti di capacità
Continuità operativa: 99,999% di disponibilità ottenuta grazie alla progettazione di un'architettura ridondante
Scalabilità: Infrastrutture progettate per scalare fino a 3 volte la capacità attuale senza modifiche architettoniche
Costo totale di proprietà: riduzione del 35% del TCO a 3 anni grazie a una selezione ottimizzata dell'hardware e all'efficienza energetica

Timeline e esecuzione del progetto

Fase di pianificazione: 4 settimane di analisi dettagliata dei requisiti e progettazione di architetture
Fase 1 Consegna: 6 settimane per l'implementazione e la convalida dell'infrastruttura di calcolo
Fase 2 consegna: 8 settimane per l'implementazione dello stoccaggio e le prove di integrazione
Test di accettazione da parte dell'utente: 2 settimane di validazione completa delle prestazioni
Durata totale del progetto: 20 settimane dalla firma del contratto al pieno avvio della produzione

Testimonianza del cliente

"La soluzione infrastrutturale fornita da questo partner ha trasformato le nostre capacità di ricerca sull'IA.combinato con la robusta soluzione di storage Dell, ci ha fornito una base che non solo soddisfa le nostre esigenze attuali, ma ci posiziona per la crescita futura.L'approccio di distribuzione graduale ha ridotto al minimo le interruzioni aziendali assicurandoci la potenza di calcolo necessaria quando ne avevamo bisogno. "

CTO, grande impresa russa

Mappa stradale per il futuro

Ottimizzazione del carico di lavoro: Accelerazione della GPU aggiuntiva per specifici framework di apprendimento profondo
Espansione del magazzino: Aumento previsto della capacità a 5PB con l'attuazione di NVMe-oF
Integrazione dell'Edge Computing: Estensione dell'infrastruttura per supportare carichi di lavoro di IA distribuiti
Integrazione con il cloud: Strategia di cloud ibrido che sfrutta gli investimenti in loco esistenti

Classificazione del progetto: Infrastruttura AI aziendale. Informatica ad alte prestazioni. Modernizzazione del Data Center.

Industria Verticale: Ricerca sull'intelligenza artificiale. Servizi finanziari. Informatica scientifica.

Regione geografica: EMEA (Russia)

PartenariatoDell Technologies Partner Platinum NVIDIA Elite Partner Inspire Partner Strategico

Questo caso di studio dimostra la nostra capacità di fornire soluzioni infrastrutturali complesse e multivenditore che affrontano le sfide del mondo reale fornendo al contempo un ROI chiaro e misurabile.Il nostro approccio di distribuzione graduale garantisce un minimo di interruzioni aziendali massimizzando l'efficienza operativa e la scalabilità futura.

Nota: i dettagli specifici del cliente e le metriche di prestazione possono essere adeguati in base agli accordi di riservatezza e ai risultati effettivi misurati.

Notizie

Casi

Distribuzione di infrastrutture di High-Performance Computing per un'impresa russa leader