دیتاسنترهای آماده هوش مصنوعی؛ زیرساخت پردازشهای سنگین
- تحول زیرساخت: مدیران فناوری معماری شبکهها را به سمت دیتاسنترهای آماده هوش مصنوعی و خوشههای پردازشگر گرافیکی (GPU) تغییر میدهند.
- تراکم توان بالا: سرورهای جدید مصرف برق هر رک را به بیش از ۵۰ الی ۱۰۰ کیلووات افزایش میدهند.
- سیستمهای خنککننده نوین: طراحان زیرساخت استفاده از خنککنندههای گازی را متوقف و خنککنندههای مایع را جایگزین میکنند.
- شبکه و ذخیرهسازی: مهندسان، پیادهسازی شبکههای بدون افت داده و پرسرعت را ضروری میدانند.
ظهور مدلهای زبانی بزرگ (LLM) و توسعه روزافزون ابزارهای مولد، توان محاسباتی عظیمی را میطلبد که زیرساختهای سنتی از تأمین آن عاجزند. به همین دلیل، مدیران IT سرمایهگذاری روی دیتاسنترهای آماده هوش مصنوعی را به یک ضرورت غیرقابل انکار در دنیای فناوری تبدیل کردهاند. علاوه بر این، مهندسان شبکه این زیرساختهای نوین را به طور خاص برای تحمل بالاترین سطح از پردازش موازی، مدیریت حرارت شدید و انتقال سریع دادهها طراحی و بهینهسازی میکنند.
چرا سازمانها دیتاسنترهای آماده هوش مصنوعی را جایگزین مدلهای سنتی میکنند؟
همانطور که میدانید، طراحان زیرساخت مراکز داده سنتی را عمدتاً برای اجرای نرمافزارهای سازمانی و میزبانی وب میسازند و پردازشهای آنها را نیز بر پایه CPU برنامهریزی میکنند. اما در مقابل، سرورها در دیتاسنترهای آماده هوش مصنوعی میلیاردها محاسبه ماتریسی را به صورت همزمان انجام میدهند. در نتیجه، این تفاوت در ماهیت بار کاری باعث میشود که طراحیهای قبلی مشکلاتی نظیر کمبود شدید توان برق در هر رک، ناتوانی در دفع حرارت و گلوگاههای شبکهای را تجربه کنند.
تجهیزات پردازشی: پادشاهی بلامنازع GPUها در دیتاسنترهای آماده هوش مصنوعی
در واقع، خوشههای پردازنده گرافیکی (GPU) نقش قلب تپنده را در دیتاسنترهای آماده هوش مصنوعی ایفا میکنند. به عنوان نمونه، شرکتهایی نظیر انویدیا (Nvidia) تراشههای قدرتمندی را تولید میکنند که به دلیل معماری موازی، عملکرد ایدهآلی را برای یادگیری ماشین و پردازش شبکههای عصبی ارائه میدهند. بنابراین، مدیران IT با قرار دادن متراکم این سرورها در کنار یکدیگر، قدرتی معادل صدها سرور سنتی را در فضای بسیار کمتری فراهم میکنند.
چالش حرارت و گذار به خنککنندههای مایع
از سوی دیگر، مهندسان کنترل حرارت را یکی از بزرگترین چالشها در طراحی دیتاسنترهای آماده هوش مصنوعی میدانند. به طور معمول، رکهای حاوی سرورهای GPU بیش از ۱۰۰ کیلووات گرما تولید میکنند. از این رو، سیستمهای خنککننده هوایی (CRAC/CRAH) دیگر پاسخگوی این حجم از گرما نیستند. به همین جهت، متخصصان زیرساخت، فناوریهای خنککننده مایع (Liquid Cooling) مانند Direct-to-Chip یا Immersion Cooling (غوطهوری سرورها در مایع مخصوص) را به عنوان یک استاندارد قطعی در این حوزه اجرا میکنند.
اهمیت شبکههای پرسرعت در زیرساخت AI
علاوه بر بحث پردازش، هنگام آموزش مدلهای زبانی، هزاران پردازنده باید دائماً دادهها را با یکدیگر تبادل کنند. در چنین شرایطی، کوچکترین تأخیر در شبکه کل فرآیند را مختل میکند. بنابراین، کارشناسان شبکه استفاده از بسترهای بسیار سریع نظیر InfiniBand و اترنتهای ۴۰۰ و ۸۰۰ گیگابیتی را در دیتاسنترهای آماده هوش مصنوعی کاملاً حیاتی میدانند تا سرورها فرآیند تبادل دادههای عظیم را بدون هیچگونه توقفی پیش ببرند.
مقایسه دیتاسنتر سنتی و دیتاسنتر آماده هوش مصنوعی
| ویژگی مورد بررسی | دیتاسنترهای سنتی (Enterprise) | دیتاسنترهای آماده هوش مصنوعی (AI-Ready) |
|---|---|---|
| محور اصلی پردازش | پردازندههای مرکزی (CPU) | پردازندههای گرافیکی (GPU / TPU / NPU) |
| تراکم توان (برق هر رک) | ۵ الی ۱۵ کیلووات | ۴۰ الی ۱۲۰+ کیلووات |
| سیستم خنککننده | خنککننده هوایی (گازی) | خنککنندههای مایع (Direct-to-Chip یا Immersion) |
| معماری شبکه | اترنت استاندارد (۱۰ الی ۱۰۰ گیگابیت) | InfiniBand یا اترنت پرسرعت (۴۰۰ الی ۸۰۰ گیگابیت) |
تحلیل اختصاصی آلفاتک: جمعبندی
در نهایت، تحلیلگران آلفاتک تاکید میکنند که موج جدید هوش مصنوعی تنها یک تغییر نرمافزاری نیست، بلکه متخصصان آن را یک انقلاب سختافزاری عظیم به شمار میآورند. در نتیجه، اگر سازمانی روی دیتاسنترهای آماده هوش مصنوعی سرمایهگذاری نکند، قطعاً از رقابتهای آینده جا میماند.


