logo
케이스
솔루션 세부 사항
> 케이스 >
선도적인 러시아 기업을 위한 고성능 컴퓨팅 인프라 구축
이벤트
문의하기
86--13552664309
지금 연락하세요

선도적인 러시아 기업을 위한 고성능 컴퓨팅 인프라 구축

2026-04-20

최근 회사 사건 선도적인 러시아 기업을 위한 고성능 컴퓨팅 인프라 구축
클라이언트 개요

인공지능 연구 및 데이터 집약적 애플리케이션을 전문으로 하는 저명한 러시아 기업이 증가하는 컴퓨팅 수요를 지원하기 위해 최첨단 컴퓨팅 인프라를 구축하고자 했습니다. 이 조직은 강력한 데이터 저장 기능을 유지하면서 복잡한 딥러닝 워크로드를 처리할 수 있는 확장 가능하고 고성능 솔루션을 필요로 했습니다.

프로젝트 과제
  • 컴퓨팅 수요: AI/ML 모델 학습 및 추론을 위한 상당한 GPU 가속 처리 능력 필요
  • 스토리지 요구 사항: 대규모 데이터셋을 위한 고용량, 고성능 스토리지 솔루션
  • 확장성: 주요 아키텍처 변경 없이 향후 확장을 지원해야 하는 인프라
  • 안정성: 최소 다운타임을 가진 엔터프라이즈급 하드웨어를 요구하는 미션 크리티컬 운영
  • 통합 복잡성: 여러 하드웨어 플랫폼에 걸쳐 컴퓨팅 및 스토리지 계층 간의 원활한 통합
솔루션 아키텍처

저희 팀은 배포 전반에 걸쳐 운영 연속성을 유지하면서 최적의 성능을 보장하는 두 가지 전략적 단계로 제공되는 계층형 인프라 솔루션을 설계하고 구현했습니다.

1단계: 컴퓨팅 인프라 배포

타임라인: 초기 배포는 컴퓨팅 기반 구축에 중점

하드웨어 구성:

  • Dell PowerEdge R750 서버 10대 (12LFF 구성)
    • 듀얼 Intel Xeon 확장 가능 프로세서 (완전 구성)
    • 서버당 1.5TB DDR4 ECC RAM
    • RAID 구성의 NVMe SSD 12개 (3.84TB)
    • GPU 가속: 서버당 NVIDIA Tesla V100 32GB (Turbo) GPU 2개
    • 총 GPU 용량: 640GB의 고대역폭 메모리를 제공하는 NVIDIA V100 GPU 20개
    • 중복 연결이 있는 10GbE 네트워킹
    • 엔터프라이즈급 전력 및 냉각 시스템
  • Inspur NF5468M6 AI 서버 3대 (Inspur YuanNao 플랫폼)
    • 딥러닝 워크로드에 최적화됨
    • AI 가속 기능이 있는 듀얼 Intel Xeon 프로세서
    • 서버당 768GB DDR4 RAM
    • NVIDIA A100 Tensor Core GPU 8개 (또는 동급 고성능 AI 가속기)
    • 모델 학습 가속을 위한 NVMe 스토리지 캐시
    • 고속 상호 연결을 위한 25GbE 네트워킹
2단계: 엔터프라이즈 스토리지 구현

타임라인: 포괄적인 인프라를 완료하기 위한 후속 배포

하드웨어 구성:

  • Dell PowerVault ME5024 iSCSI 스토리지 어레이 10대
    • 최대 가용성을 위한 듀얼 컨트롤러 액티브-액티브 구성
    • 스토리지 용량: 어레이당 SAS HDD 24개 (7.68TB) (어레이당 원시 용량 184.32TB)
    • 총 원시 스토리지 용량: 모든 어레이에 걸쳐 1,843.2TB
    • 핫 스페어 드라이브를 갖춘 고급 RAID 보호 (RAID 6/60)
    • 16Gb Fibre Channel 및 10Gb iSCSI 연결 옵션
    • SSD 캐시와 고용량 HDD 간의 자동 계층화
    • 통합 데이터 중복 제거 및 압축 기능
    • 예측 분석 기능이 있는 엔터프라이즈급 관리 소프트웨어
기술 통합 하이라이트
  • 통합 관리 플랫폼: 중앙 집중식 모니터링 및 관리를 위한 Dell OpenManage 및 Inspur ISPIM 통합
  • 고속 상호 연결: 컴퓨팅 노드를 스토리지 어레이에 연결하는 25GbE 백본 네트워크
  • 스토리지 가상화: VMware vSAN 및 Dell PowerStore 소프트웨어 정의 스토리지 통합
  • GPU 리소스 풀링: 최적화된 GPU 간 통신을 위한 NVIDIA GPU Direct RDMA
  • 백업 및 재해 복구: 오프사이트 복제를 포함한 포괄적인 데이터 보호 전략
비즈니스 영향
  • 성능 향상: 이전 인프라 대비 AI 모델 학습 처리량 400% 증가
  • 스토리지 효율성: 높은 용량 요구 사항을 유지하면서 스토리지 지연 시간 60% 감소
  • 운영 연속성: 중복 아키텍처 설계를 통해 99.999% 가동 시간 달성
  • 확장성: 아키텍처 변경 없이 현재 용량의 3배까지 확장 가능하도록 설계된 인프라
  • 총 소유 비용: 최적화된 하드웨어 선택 및 전력 효율성을 통한 3년 TCO 35% 감소
프로젝트 타임라인 및 실행
  • 계획 단계: 상세 요구 사항 분석 및 아키텍처 설계 4주
  • 1단계 배포: 컴퓨팅 인프라 배포 및 검증 6주
  • 2단계 배포: 스토리지 구현 및 통합 테스트 8주
  • 사용자 수락 테스트: 포괄적인 성능 검증 2주
  • 총 프로젝트 기간: 계약 체결부터 전체 프로덕션 배포까지 20주
클라이언트 추천사

"이 파트너가 제공한 인프라 솔루션은 저희 AI 연구 역량을 혁신했습니다. Dell 컴퓨팅 플랫폼과 Inspur AI 서버 간의 원활한 통합은 강력한 Dell 스토리지 솔루션과 결합되어 현재 요구 사항을 충족할 뿐만 아니라 미래 성장을 위한 기반을 마련해 주었습니다. 단계적 배포 접근 방식은 비즈니스 중단을 최소화하면서 필요할 때 필요한 컴퓨팅 성능을 확보할 수 있도록 했습니다."

— CTO, 주요 러시아 기업

향후 로드맵
  • AI 워크로드 최적화: 특정 딥러닝 프레임워크를 위한 추가 GPU 가속
  • 스토리지 확장: NVMe-oF 구현을 통해 5PB로 용량 증설 계획
  • 엣지 컴퓨팅 통합: 분산 AI 워크로드를 지원하기 위한 인프라 확장
  • 클라우드 통합: 기존 온프레미스 투자를 활용하는 하이브리드 클라우드 전략

이 사례 연구는 실제 비즈니스 문제를 해결하는 복잡한 다중 공급업체 인프라 솔루션을 제공하는 당사의 역량을 보여주며, 명확하고 측정 가능한 ROI를 제공합니다. 당사의 단계적 배포 접근 방식은 비즈니스 중단을 최소화하면서 운영 효율성과 미래 확장성을 극대화합니다.

참고: 기밀 유지 계약 및 실제 측정 결과에 따라 특정 클라이언트 세부 정보 및 성능 지표가 조정될 수 있습니다.