logo
پرونده ها
جزئیات راه حل
خونه > پرونده ها >
گسترش زیرساخت های محاسباتی با عملکرد بالا برای شرکت های پیشرو روسیه
حوادث
با ما تماس بگیرید
86--13552664309
هم اکنون تماس بگیرید

گسترش زیرساخت های محاسباتی با عملکرد بالا برای شرکت های پیشرو روسیه

2026-04-20

آخرین پرونده شرکت درباره گسترش زیرساخت های محاسباتی با عملکرد بالا برای شرکت های پیشرو روسیه
خلاصه ی مشتری

A prominent Russian enterprise specializing in artificial intelligence research and data-intensive applications sought to establish a cutting-edge computing infrastructure to support their growing computational demandsاین سازمان نیاز به یک راه حل مقیاس پذیر و با عملکرد بالا داشت که قادر به مدیریت حجم کار یادگیری عمیق پیچیده در حالی که قابلیت ذخیره سازی داده های قوی را حفظ می کند.

چالش های پروژه
  • الزامات محاسباتی: نیاز به قدرت پردازش قابل توجهی با سرعت GPU برای آموزش و نتیجه گیری مدل AI / ML
  • الزامات ذخیره سازی: راه حل ذخیره سازی با ظرفیت بالا و عملکرد بالا برای مجموعه داده های بزرگ
  • مقیاس پذیری: زیرساخت ها باید بدون تغییرات بزرگ معماری، توسعه آینده را پشتیبانی کنند
  • قابلیت اطمینان: عملیات های مهم که نیاز به سخت افزار سطح شرکت با حداقل زمان توقف دارند
  • پیچیدگی ادغام: ادغام یکپارچه بین لایه های محاسباتی و ذخیره سازی در چندین سیستم عامل سخت افزاری
معماری راه حل

تیم ما یک راه حل زیرساخت طبقه بندی شده را طراحی و اجرا کرد که در دو مرحله استراتژیک تحویل داده می شود و عملکرد مطلوب را در حالی که تداوم عملیاتی را در طول استقرار حفظ می کند ، تضمین می کند.

فاز ۱: راه اندازی زیرساخت های محاسباتی

جدول زمانی: استفاده اولیه متمرکز بر ایجاد پایه های محاسباتی

پیکربندی سخت افزار:

  • 10 x سرورهای Dell PowerEdge R750 (12LFF Configuration)
    • پردازنده های دوگانه Intel Xeon Scalable (به طور کامل پیکربندی شده)
    • 1.5TB DDR4 ECC RAM در هر سرور
    • 12 x 3.84TB NVMe SSD در پیکربندی RAID
    • سرعت گرافیک: 2 x NVIDIA Tesla V100 32GB (Turbo) GPU در هر سرور
    • ظرفیت کل GPU: 20 GPU NVIDIA V100 که 640GB حافظه پهنای باند بالا را فراهم می کند
    • شبکه های 10GbE با اتصالات اضافی
    • سیستم های برق و خنک کننده برای شرکت ها
  • 3 x سرورهای هوش مصنوعی Inspur NF5468M6 (پلتفرم YuanNao Inspur)
    • بهینه سازی شده به طور خاص برای بار کار یادگیری عمیق
    • پردازنده های دوگانه Intel Xeon با ویژگی های شتاب AI
    • ۷۶۸ گیگابایت رم DDR4 در هر سرور
    • 8 x NVIDIA A100 Tensor Core GPU (یا شتاب دهنده های AI با عملکرد بالا معادل)
    • حافظه حافظه NVMe برای شتاب آموزش مدل
    • شبکه 25GbE برای اتصال بین المللی با سرعت بالا
فاز ۲: اجرای ذخیره سازی شرکت

جدول زمانی: راه اندازی بعدی برای تکمیل زیرساخت های جامع

پیکربندی سخت افزار:

  • 10 x Dell PowerVault ME5024 iSCSI ذخیره سازی آرایه
    • پیکربندی فعال-فعال دو کنترلر برای حداکثر دسترسی
    • ظرفیت ذخیره سازی: 24 x 7.68TB SAS HDD در هر آرایه (184.32TB ظرفیت خام در هر آرایه)
    • کل ظرفیت ذخیره سازی خام: 1،843.2TB در تمام آرایه ها
    • حفاظت پیشرفته RAID (RAID 6/60) با درایوهای ذخیره گرم
    • گزینه های اتصال 16 گیگابایتی و 10 گیگابایتی iSCSI
    • طبقه بندی خودکار بین حافظه حافظه SSD و هارد دیسک های با ظرفیت بالا
    • ویژگی های یکپارچه حذف تکراری و فشرده سازی داده ها
    • نرم افزار مدیریت درجه شرکت با تحلیل پیش بینی
نکات برجسته ی ادغام فنی
  • پلتفرم مدیریت واحد: ادغام Dell OpenManage و Inspur ISPIM برای نظارت و مدیریت متمرکز
  • اتصال با سرعت بالا: شبکه ستون فقرات 25GbE که گره های محاسباتی را به آرایه های ذخیره سازی متصل می کند
  • مجازی سازی ذخیره سازی: VMware vSAN و ادغام ذخیره سازی تعریف شده نرم افزاری Dell PowerStore
  • جمع آوری منابع GPU: NVIDIA GPU Direct RDMA برای ارتباطات بهینه شده GPU به GPU
  • پشتیبان گیری و بازیابی از فاجعه: استراتژی جامع حفاظت از داده ها با تکرار خارج از محل
تاثیر کسب و کار
  • بهبود عملکرد: افزایش 400% در تولید آموزش مدل هوش مصنوعی در مقایسه با زیرساخت های قبلی
  • کارایی ذخیره سازی: کاهش 60٪ در تاخیر ذخیره سازی در حالی که نیازهای ظرفیت بالا را حفظ می کند
  • تداوم عملیات: 99.999٪ زمان عملیاتی از طریق طراحی معماری اضافی به دست آمده است
  • مقیاس پذیری: زیرساخت های طراحی شده برای مقیاس بندی به ظرفیت فعلی 3x بدون تغییرات معماری
  • کل هزینه مالکیت: کاهش ۳۵٪ در ۳ سال TCO از طریق انتخاب بهینه سخت افزار و بهره وری انرژی
جدول زمانی پروژه و اجرای آن
  • مرحله برنامه ریزی: 4 هفته تجزیه و تحلیل دقیق الزامات و طراحی معماری
  • مرحله 1 تحویل: 6 هفته برای استقرار و تأیید زیرساخت های محاسباتی
  • مرحله 2 تحویل: 8 هفته برای اجرای ذخیره سازی و آزمایش ادغام
  • تست پذیرش کاربر: 2 هفته اعتبارسنجی عملکرد جامع
  • کل طول پروژه: 20 هفته از امضای قرارداد تا راه اندازی کامل تولید
شهادت مشتری

راه حل زیرساخت ارائه شده توسط این شریک توانایی های تحقیقاتی هوش مصنوعی ما را تغییر داده است. ادغام بی نقص بین سیستم عامل های محاسباتی دِل و سرورهای هوش مصنوعی اینسپور،در ترکیب با راه حل ذخیره سازی محکم دِل، ما را با پایه ای که نه تنها نیازهای فعلی ما را برآورده می کند، بلکه ما را برای رشد آینده آماده می کند.رویکرد پیاده سازی مرحله ای، اختلال در کسب و کار را به حداقل می رساند در حالی که اطمینان حاصل می کند که ما قدرت محاسباتی مورد نیازمان را در زمان مورد نیازمان داریم. "

مدیر فناوری، شرکت بزرگ روسیه

نقشه راه آینده
  • بهینه سازی بار کاری هوش مصنوعی: سرعت افزوده GPU برای چارچوب های یادگیری عمیق خاص
  • گسترش انبار: افزایش ظرفیت برنامه ریزی شده به 5PB با اجرای NVMe-oF
  • ادغام محاسبات کناری: گسترش زیرساخت ها برای پشتیبانی از بار کاری توزیع شده هوش مصنوعی
  • ادغام ابر: استراتژی ابر ترکیبی با استفاده از سرمایه گذاری موجود در محل

این مطالعه موردی توانایی ما را برای ارائه راه حل های زیرساخت پیچیده و چند فروشنده که به چالش های کسب و کار دنیای واقعی پاسخ می دهند و در عین حال ROI واضح و قابل اندازه گیری را ارائه می دهد، نشان می دهد.رویکرد ما از پیاده سازی مرحله ای تضمین می کند حداقل اختلال در کسب و کار در حالی که حداکثر بهره وری عملیاتی و مقیاس پذیری آینده.

توجه: جزئیات خاص مشتری و معیارهای عملکرد ممکن است بر اساس توافق نامه های محرمانه و نتایج واقعی اندازه گیری شده تنظیم شود.