logo
กรณี
รายละเอียดของวิธีแก้ไข
บ้าน > กรณี >
การติดตั้งโครงสร้างพื้นฐานคอมพิวเตอร์สมรรถนะสูงสำหรับองค์กรชั้นนำของรัสเซีย
เหตุการณ์
ติดต่อเรา
86--13552664309
ติดต่อเลย

การติดตั้งโครงสร้างพื้นฐานคอมพิวเตอร์สมรรถนะสูงสำหรับองค์กรชั้นนำของรัสเซีย

2026-04-20

กรณีบริษัทล่าสุดเกี่ยวกับ การติดตั้งโครงสร้างพื้นฐานคอมพิวเตอร์สมรรถนะสูงสำหรับองค์กรชั้นนำของรัสเซีย
ภาพรวมลูกค้า

องค์กรชั้นนำของรัสเซียที่เชี่ยวชาญด้านการวิจัยปัญญาประดิษฐ์และการใช้งานที่ต้องใช้ข้อมูลจำนวนมาก ได้แสวงหาการสร้างโครงสร้างพื้นฐานคอมพิวเตอร์ที่ทันสมัยเพื่อรองรับความต้องการด้านการประมวลผลที่เพิ่มขึ้น องค์กรต้องการโซลูชันที่ปรับขนาดได้และมีประสิทธิภาพสูงที่สามารถจัดการกับเวิร์กโหลดการเรียนรู้เชิงลึกที่ซับซ้อน พร้อมทั้งรักษาความสามารถในการจัดเก็บข้อมูลที่แข็งแกร่ง

ความท้าทายของโครงการ
  • ความต้องการด้านการประมวลผล: ความต้องการพลังการประมวลผลที่เร่งด้วย GPU อย่างมีนัยสำคัญสำหรับการฝึกอบรมและอนุมานโมเดล AI/ML
  • ข้อกำหนดด้านการจัดเก็บข้อมูล: โซลูชันการจัดเก็บข้อมูลความจุสูง ประสิทธิภาพสูง สำหรับชุดข้อมูลขนาดใหญ่
  • ความสามารถในการปรับขนาด: โครงสร้างพื้นฐานต้องรองรับการขยายตัวในอนาคตโดยไม่มีการเปลี่ยนแปลงสถาปัตยกรรมหลัก
  • ความน่าเชื่อถือ: การดำเนินงานที่สำคัญต่อภารกิจต้องการฮาร์ดแวร์ระดับองค์กรที่มีการหยุดทำงานน้อยที่สุด
  • ความซับซ้อนในการรวมระบบ: การรวมระบบระหว่างชั้นการประมวลผลและการจัดเก็บข้อมูลอย่างราบรื่นบนแพลตฟอร์มฮาร์ดแวร์หลายแพลตฟอร์ม
สถาปัตยกรรมโซลูชัน

ทีมของเราได้ออกแบบและนำโซลูชันโครงสร้างพื้นฐานแบบแบ่งชั้นมาใช้ โดยส่งมอบในสองระยะเชิงกลยุทธ์ เพื่อให้มั่นใจถึงประสิทธิภาพสูงสุด ในขณะเดียวกันก็รักษาความต่อเนื่องในการดำเนินงานตลอดการติดตั้ง

ระยะที่ 1: การติดตั้งโครงสร้างพื้นฐานการประมวลผล

ระยะเวลา: การติดตั้งเริ่มต้นมุ่งเน้นไปที่การสร้างรากฐานการประมวลผล

การกำหนดค่าฮาร์ดแวร์:

  • เซิร์ฟเวอร์ Dell PowerEdge R750 จำนวน 10 เครื่อง (การกำหนดค่า 12LFF)
    • โปรเซสเซอร์ Intel Xeon Scalable แบบคู่ (กำหนดค่าเต็ม)
    • RAM DDR4 ECC ขนาด 1.5TB ต่อเซิร์ฟเวอร์
    • NVMe SSD จำนวน 12 ตัว ขนาด 3.84TB ในการกำหนดค่า RAID
    • การเร่งความเร็ว GPU: GPU NVIDIA Tesla V100 32GB (Turbo) จำนวน 2 ตัว ต่อเซิร์ฟเวอร์
    • ความจุ GPU ทั้งหมด: GPU NVIDIA V100 จำนวน 20 ตัว ให้หน่วยความจำแบนด์วิดท์สูง 640GB
    • เครือข่าย 10GbE พร้อมการเชื่อมต่อที่ซ้ำซ้อน
    • ระบบจ่ายไฟและระบายความร้อนระดับองค์กร
  • เซิร์ฟเวอร์ AI Inspur NF5468M6 จำนวน 3 เครื่อง (แพลตฟอร์ม Inspur YuanNao)
    • ปรับให้เหมาะสมโดยเฉพาะสำหรับเวิร์กโหลดการเรียนรู้เชิงลึก
    • โปรเซสเซอร์ Intel Xeon แบบคู่พร้อมคุณสมบัติการเร่งความเร็ว AI
    • RAM DDR4 ขนาด 768GB ต่อเซิร์ฟเวอร์
    • GPU NVIDIA A100 Tensor Core จำนวน 8 ตัว (หรือตัวเร่งความเร็ว AI ประสิทธิภาพสูงเทียบเท่า)
    • แคช NVMe สำหรับการเร่งความเร็วการฝึกอบรมโมเดล
    • เครือข่าย 25GbE สำหรับการเชื่อมต่อความเร็วสูง
ระยะที่ 2: การนำระบบจัดเก็บข้อมูลระดับองค์กรมาใช้

ระยะเวลา: การติดตั้งต่อเนื่องเพื่อทำให้โครงสร้างพื้นฐานที่ครอบคลุมสมบูรณ์

การกำหนดค่าฮาร์ดแวร์:

  • อาร์เรย์จัดเก็บข้อมูล iSCSI Dell PowerVault ME5024 จำนวน 10 เครื่อง
    • การกำหนดค่า active-active แบบ dual-controller เพื่อความพร้อมใช้งานสูงสุด
    • ความจุในการจัดเก็บข้อมูล: HDD SAS ขนาด 7.68TB จำนวน 24 ตัว ต่ออาร์เรย์ (ความจุดิบ 184.32TB ต่ออาร์เรย์)
    • ความจุในการจัดเก็บข้อมูลดิบทั้งหมด: 1,843.2TB ในทุกอาร์เรย์
    • การป้องกัน RAID ขั้นสูง (RAID 6/60) พร้อมไดรฟ์ฮอตสแปร์
    • ตัวเลือกการเชื่อมต่อ Fibre Channel 16Gb และ iSCSI 10Gb
    • การจัดระดับอัตโนมัติระหว่างแคช SSD และ HDD ความจุสูง
    • คุณสมบัติการลดข้อมูลซ้ำซ้อนและการบีบอัดข้อมูลในตัว
    • ซอฟต์แวร์การจัดการระดับองค์กรพร้อมการวิเคราะห์เชิงคาดการณ์
ไฮไลท์การรวมระบบทางเทคนิค
  • แพลตฟอร์มการจัดการแบบรวมศูนย์: การรวม Dell OpenManage และ Inspur ISPIM สำหรับการตรวจสอบและการบริหารจัดการแบบรวมศูนย์
  • การเชื่อมต่อความเร็วสูง: เครือข่ายแบ็คโบน 25GbE เชื่อมต่อโหนดประมวลผลกับอาร์เรย์จัดเก็บข้อมูล
  • การจำลองเสมือนพื้นที่จัดเก็บข้อมูล: การรวม VMware vSAN และ Dell PowerStore ซอฟต์แวร์กำหนดพื้นที่จัดเก็บข้อมูล
  • การจัดสรรทรัพยากร GPU: NVIDIA GPU Direct RDMA สำหรับการสื่อสาร GPU ต่อ GPU ที่ปรับให้เหมาะสม
  • การสำรองข้อมูลและการกู้คืนจากภัยพิบัติ: กลยุทธ์การปกป้องข้อมูลที่ครอบคลุมพร้อมการจำลองข้อมูลนอกสถานที่
ผลกระทบทางธุรกิจ
  • การปรับปรุงประสิทธิภาพ: ปริมาณงานการฝึกอบรมโมเดล AI เพิ่มขึ้น 400% เมื่อเทียบกับโครงสร้างพื้นฐานก่อนหน้า
  • ประสิทธิภาพการจัดเก็บข้อมูล: ความหน่วงในการจัดเก็บข้อมูลลดลง 60% ในขณะที่ยังคงรักษาข้อกำหนดด้านความจุสูง
  • ความต่อเนื่องในการดำเนินงาน: ความพร้อมใช้งาน 99.999% ที่ได้รับจากการออกแบบสถาปัตยกรรมที่ซ้ำซ้อน
  • ความสามารถในการปรับขนาด: โครงสร้างพื้นฐานที่ออกแบบมาเพื่อปรับขนาดได้ถึง 3 เท่าของความจุปัจจุบันโดยไม่มีการเปลี่ยนแปลงสถาปัตยกรรม
  • ต้นทุนรวมในการเป็นเจ้าของ: ต้นทุนรวมในการเป็นเจ้าของ 3 ปี ลดลง 35% ผ่านการเลือกฮาร์ดแวร์ที่ปรับให้เหมาะสมและประสิทธิภาพการใช้พลังงาน
ระยะเวลาและดำเนินการโครงการ
  • ระยะการวางแผน: การวิเคราะห์ข้อกำหนดโดยละเอียดและการออกแบบสถาปัตยกรรม 4 สัปดาห์
  • การส่งมอบระยะที่ 1: การติดตั้งและตรวจสอบโครงสร้างพื้นฐานการประมวลผล 6 สัปดาห์
  • การส่งมอบระยะที่ 2: การติดตั้งและการทดสอบการรวมระบบจัดเก็บข้อมูล 8 สัปดาห์
  • การทดสอบการยอมรับของผู้ใช้: การตรวจสอบประสิทธิภาพที่ครอบคลุม 2 สัปดาห์
  • ระยะเวลาโครงการทั้งหมด: 20 สัปดาห์นับตั้งแต่ลงนามในสัญญาจนถึงการใช้งานเต็มรูปแบบ
คำรับรองจากลูกค้า

"โซลูชันโครงสร้างพื้นฐานที่ส่งมอบโดยพันธมิตรรายนี้ได้เปลี่ยนแปลงขีดความสามารถในการวิจัย AI ของเรา การรวมระบบที่ราบรื่นระหว่างแพลตฟอร์มการประมวลผลของ Dell และเซิร์ฟเวอร์ AI ของ Inspur ควบคู่ไปกับโซลูชันการจัดเก็บข้อมูลที่แข็งแกร่งของ Dell ได้มอบรากฐานที่ไม่เพียงแต่ตอบสนองความต้องการในปัจจุบันของเราเท่านั้น แต่ยังวางตำแหน่งเราสำหรับการเติบโตในอนาคตอีกด้วย แนวทางการติดตั้งแบบแบ่งเฟสช่วยลดการหยุดชะงักทางธุรกิจให้น้อยที่สุด ในขณะเดียวกันก็รับประกันว่าเรามีพลังการประมวลผลที่เราต้องการเมื่อเราต้องการ"

— CTO, องค์กรขนาดใหญ่ของรัสเซีย

แผนงานในอนาคต
  • การปรับปรุงเวิร์กโหลด AI ให้เหมาะสม: การเร่งความเร็ว GPU เพิ่มเติมสำหรับเฟรมเวิร์กการเรียนรู้เชิงลึกเฉพาะทาง
  • การขยายพื้นที่จัดเก็บข้อมูล: การเพิ่มความจุตามแผนเป็น 5PB พร้อมการใช้งาน NVMe-oF
  • การรวม Edge Computing: การขยายโครงสร้างพื้นฐานเพื่อรองรับเวิร์กโหลด AI แบบกระจาย
  • การรวม Cloud: กลยุทธ์คลาวด์แบบไฮบริด ใช้ประโยชน์จากการลงทุนในองค์กรที่มีอยู่

กรณีศึกษานี้แสดงให้เห็นถึงความสามารถของเราในการส่งมอบโซลูชันโครงสร้างพื้นฐานที่ซับซ้อนและหลากหลายผู้จำหน่าย ซึ่งสามารถแก้ไขปัญหาทางธุรกิจในโลกแห่งความเป็นจริง พร้อมทั้งให้ผลตอบแทนจากการลงทุนที่ชัดเจนและวัดผลได้ แนวทางของเราในการติดตั้งแบบแบ่งเฟสช่วยให้มั่นใจได้ว่าการหยุดชะงักทางธุรกิจจะน้อยที่สุด ในขณะเดียวกันก็เพิ่มประสิทธิภาพการดำเนินงานและความสามารถในการปรับขนาดในอนาคตให้สูงสุด

หมายเหตุ: รายละเอียดลูกค้าและตัวชี้วัดประสิทธิภาพเฉพาะอาจมีการปรับเปลี่ยนตามข้อตกลงการรักษาความลับและผลลัพธ์ที่วัดได้จริง