logo
Cas
DéTAILS DE LA SOLUTION
Maison > Cas >
Déploiement d'une infrastructure de calcul haute performance pour une entreprise russe de premier plan
Événements
Contactez-nous
86--13552664309
Contactez maintenant

Déploiement d'une infrastructure de calcul haute performance pour une entreprise russe de premier plan

2026-04-20

Dernière affaire de l'entreprise Déploiement d'une infrastructure de calcul haute performance pour une entreprise russe de premier plan
Aperçu du client

Une entreprise russe de premier plan spécialisée dans la recherche en intelligence artificielle et les applications gourmandes en données a cherché à établir une infrastructure informatique de pointe pour répondre à ses besoins informatiques croissants. L'organisation avait besoin d'une solution évolutive et haute performance capable de gérer des charges de travail d'apprentissage profond complexes tout en maintenant de solides capacités de stockage de données.

Défis du projet
  • Besoins informatiques: Nécessité d'une puissance de traitement importante accélérée par GPU pour la formation et l'inférence de modèles IA/ML
  • Exigences de stockage: Solution de stockage haute capacité et haute performance pour des ensembles de données massifs
  • Évolutivité: L'infrastructure doit supporter une expansion future sans changements architecturaux majeurs
  • Fiabilité: Opérations critiques nécessitant du matériel de qualité professionnelle avec un temps d'arrêt minimal
  • Complexité d'intégration: Intégration transparente entre les couches de calcul et de stockage sur plusieurs plateformes matérielles
Architecture de la solution

Notre équipe a conçu et mis en œuvre une solution d'infrastructure à plusieurs niveaux, livrée en deux phases stratégiques, garantissant des performances optimales tout en maintenant la continuité opérationnelle tout au long du déploiement.

Phase 1 : Déploiement de l'infrastructure de calcul

Calendrier: Le déploiement initial s'est concentré sur l'établissement de la base de calcul

Configuration matérielle:

  • 10 serveurs Dell PowerEdge R750 (configuration 12LFF)
    • Processeurs Intel Xeon Scalable doubles (entièrement configurés)
    • 1,5 To de RAM DDR4 ECC par serveur
    • 12 SSD NVMe de 3,84 To en configuration RAID
    • Accélération GPU: 2 GPU NVIDIA Tesla V100 32 Go (Turbo) par serveur
    • Capacité GPU totale : 20 GPU NVIDIA V100 offrant 640 Go de mémoire à large bande passante
    • Réseau 10 GbE avec connexions redondantes
    • Systèmes d'alimentation et de refroidissement de qualité professionnelle
  • 3 serveurs IA Inspur NF5468M6 (plateforme Inspur YuanNao)
    • Optimisés spécifiquement pour les charges de travail d'apprentissage profond
    • Processeurs Intel Xeon doubles avec fonctionnalités d'accélération IA
    • 768 Go de RAM DDR4 par serveur
    • 8 GPU NVIDIA A100 Tensor Core (ou accélérateurs IA haute performance équivalents)
    • Cache de stockage NVMe pour l'accélération de la formation de modèles
    • Réseau 25 GbE pour une interconnexion à haute vitesse
Phase 2 : Mise en œuvre du stockage d'entreprise

Calendrier: Déploiement de suivi pour compléter l'infrastructure complète

Configuration matérielle:

  • 10 baies de stockage iSCSI Dell PowerVault ME5024
    • Configuration active-active à double contrôleur pour une disponibilité maximale
    • Capacité de stockage: 24 disques durs SAS de 7,68 To par baie (184,32 To de capacité brute par baie)
    • Capacité de stockage brute totale : 1 843,2 To sur toutes les baies
    • Protection RAID avancée (RAID 6/60) avec disques de secours à chaud
    • Options de connectivité Fibre Channel 16 Go et iSCSI 10 Go
    • Tiering automatisé entre le cache SSD et les disques durs haute capacité
    • Fonctionnalités intégrées de déduplication et de compression de données
    • Logiciel de gestion de qualité professionnelle avec analyse prédictive
Points forts de l'intégration technique
  • Plateforme de gestion unifiée: Intégration Dell OpenManage et Inspur ISPIM pour la surveillance et l'administration centralisées
  • Interconnexion à haute vitesse: Réseau dorsal 25 GbE connectant les nœuds de calcul aux baies de stockage
  • Virtualisation du stockage: Intégration du stockage défini par logiciel VMware vSAN et Dell PowerStore
  • Regroupement des ressources GPU: NVIDIA GPU Direct RDMA pour une communication GPU à GPU optimisée
  • Sauvegarde et reprise après sinistre: Stratégie complète de protection des données avec réplication hors site
Impact commercial
  • Amélioration des performances: Augmentation de 400 % du débit de formation des modèles IA par rapport à l'infrastructure précédente
  • Efficacité du stockage: Réduction de 60 % de la latence de stockage tout en maintenant des exigences de haute capacité
  • Continuité opérationnelle: Disponibilité de 99,999 % obtenue grâce à une conception d'architecture redondante
  • Évolutivité: Infrastructure conçue pour évoluer jusqu'à 3 fois la capacité actuelle sans changements architecturaux
  • Coût total de possession: Réduction de 35 % du coût total de possession sur 3 ans grâce à une sélection matérielle optimisée et à l'efficacité énergétique
Calendrier et exécution du projet
  • Phase de planification: 4 semaines d'analyse détaillée des exigences et de conception de l'architecture
  • Livraison Phase 1: 6 semaines pour le déploiement et la validation de l'infrastructure de calcul
  • Livraison Phase 2: 8 semaines pour la mise en œuvre du stockage et les tests d'intégration
  • Tests d'acceptation par l'utilisateur: 2 semaines de validation complète des performances
  • Durée totale du projet: 20 semaines entre la signature du contrat et le déploiement complet en production
Témoignage client

"La solution d'infrastructure livrée par ce partenaire a transformé nos capacités de recherche en IA. L'intégration transparente entre les plateformes de calcul Dell et les serveurs IA Inspur, combinée à la solution de stockage Dell robuste, nous a fourni une base qui répond non seulement à nos besoins actuels, mais nous positionne également pour une croissance future. L'approche de déploiement par phases a minimisé les perturbations de l'activité tout en garantissant que nous disposions de la puissance de calcul dont nous avions besoin quand nous en avions besoin."

— CTO, Grande entreprise russe

Feuille de route future
  • Optimisation des charges de travail IA: Accélération GPU supplémentaire pour des frameworks d'apprentissage profond spécifiques
  • Expansion du stockage: Augmentation prévue de la capacité à 5 Po avec mise en œuvre de NVMe-oF
  • Intégration de l'informatique en périphérie: Extension de l'infrastructure pour prendre en charge les charges de travail IA distribuées
  • Intégration cloud: Stratégie de cloud hybride tirant parti de l'investissement sur site existant

Cette étude de cas démontre notre capacité à fournir des solutions d'infrastructure complexes et multi-fournisseurs qui répondent aux défis commerciaux du monde réel tout en offrant un retour sur investissement clair et mesurable. Notre approche de déploiement par phases garantit une perturbation minimale de l'activité tout en maximisant l'efficacité opérationnelle et l'évolutivité future.

Remarque : Les détails spécifiques du client et les métriques de performance peuvent être ajustés en fonction des accords de confidentialité et des résultats mesurés réels.