آغاز عصر جدید در کارخانههای هوش مصنوعی؛ ورود پلتفرم افسانهای Vera Rubin انویدیا به خط تولید انبوه
- تولد یک غول پردازشی: پایان شایعات تأخیر؛ انویدیا تولید انبوه پلتفرم قدرتمند خود شامل پردازندههای گرافیکی Rubin و پردازندههای مرکزی Vera را رسماً آغاز کرد.
- جهش پنج برابری عملکرد: ثبت رکورد ۵۰ پتافلاپس در استنتاج (Inference) و ارتقای پهنای باند حافظه HBM4 به ۲۲ ترابایتبرثانیه.
- ارتباطات نوری و شبکهای: بهکارگیری فوتونیک سیلیکونی (Spectrum-X 102.4T) و سوئیچهای NVLink 6 با توان انتقال داده ۲۸.۸ ترابایتبرثانیه.
- اقتصاد هوش مصنوعی: کاهش ۱۰ برابری هزینه تولید هر توکن در پردازشهای سنگین و استقرار مدلهای زبانی در رکهای قدرتمند NVL72.
صنعت هوش مصنوعی با سرعتی سرسامآور در حال بلعیدن توان پردازشی دیتاسنترهاست و محدودیتهای سختافزاری به یکی از بزرگترین دغدغههای شرکتهای فناوری تبدیل شده بود. تا چند هفته پیش، شایعاتی مبنی بر تأخیر در زنجیره تأمین تراشههای نسل جدید انویدیا بازار را ملتهب کرده بود؛ اما این غول تراشهسازی، با یک حرکت استراتژیک، خط تولید قدرتمندترین پلتفرم هوش مصنوعی ایجنتمحور جهان یعنی Vera Rubin را استارت زد. انویدیا با این اقدام نه تنها جایگاه خود را به عنوان پادشاه بلامنازع پردازندههای گرافیکی تثبیت کرده، بلکه هدفگذاری جسورانهای برای تصاحب بازار ۲۰۰ میلیارد دلاری پردازندههای مرکزی (CPU) انجام داده است.
کالبدشکافی Rubin GPU؛ هیولای ۳۳۶ میلیارد ترانزیستوری
در قلب پلتفرم جدید انویدیا، پردازنده گرافیکی Rubin میتپد؛ سیلیکونی که با بهرهگیری از دو قطعه Reticle Die و تجمیع ۳۳۶ میلیارد ترانزیستور، مرزهای فیزیک نیمههادیها را جابجا کرده است. این پردازشگر منحصراً برای بلعیدن دادهها در فرآیندهای یادگیری ماشین و استنتاج مدلهای عظیم طراحی شده است.
آمار و ارقام این تراشه حیرتانگیز است: قدرت استنتاج (Inference) با فرمت NVFP4 به ۵۰ پتافلاپس رسیده است که نشاندهنده یک جهش ۵ برابری نسبت به معماری نسل قبل (Blackwell) است. در بخش آموزش مدلها نیز قدرت آن به ۳۵ پتافلاپس افزایش یافته است. اما قدرت محاسباتی بدون حافظه سریع بیفایده است؛ از این رو، انویدیا از حافظههای پیشرفته HBM4 با پهنای باند خیرهکننده ۲۲ ترابایتبرثانیه استفاده کرده که سرعت انتقال داده را ۲.۸ برابر نسبت به نسل قبل ارتقا میدهد.
پردازنده مرکزی Vera؛ معماری Olympus و تسخیر دنیای CPU
انویدیا دیگر تنها یک تولیدکننده GPU نیست. پردازنده مرکزی Vera (با اسم رمز Olympus) که بر پایه معماری سفارشی و نسل بعدی Arm توسعه یافته، دارای ۲۲۷ میلیارد ترانزیستور است. این غول پردازشی به ۸۸ هسته فیزیکی و ۱۷۶ رشته (Thread) مجهز شده و از فناوری پیشرفته Spatial Multi-Threading پشتیبانی میکند.
به لطف استفاده از مسیرهای ارتباطی NVLink-C2C، پهنای باند یکپارچه بین پردازندهها به ۱.۸ ترابایتبرثانیه میرسد. همچنین، ظرفیت حافظه سیستم با رشدی ۳ برابری نسبت به پردازنده نسل قبل (Grace)، به ۱.۵ ترابایت ارتقا یافته است. این ترکیب مهندسی، پردازنده Vera را در عملیاتهای فشردهسازی و خطوط لوله CI/CD تا دو برابر سریعتر از رقبا کرده و از محاسبات کاملاً محرمانه در سطح رک پشتیبانی میکند.
ستون فقرات ارتباطی؛ از NVLink 6 تا فوتونیک سیلیکونی
هنگامی که صدها تراشه قدرتمند در یک دیتاسنتر در حال کار هستند، گلوگاه اصلی “شبکه ارتباطی” بین آنهاست. انویدیا برای رفع این گلوگاه، نسل ششم سوئیچهای خود موسوم به NVLink 6 را معرفی کرده است. این سوئیچها با بهرهگیری از خنککننده مایع، پهنای باندی معادل ۲۸.۸ ترابایتبرثانیه را فراهم میکنند.
برای تبادل داده در سطح کلانِ کارخانه هوش مصنوعی، انویدیا ماژولهای ConnectX-9 SuperNIC (با پهنای باند ۱.۶ ترابایت بر ثانیه و پروتکل RDMA) و BlueField-4 DPU (ترکیبی از پردازنده ۶۴ هستهای با ظرفیت ۸۰۰ گیگابیت) را به کار گرفته است. اما شاهکار نهایی، ورود فناوری انتقال داده با نور است: سیستم Spectrum-X Ethernet Co-Packaged Optics با بهرهگیری از فوتونیک سیلیکونی ۲۰۰ گیگابیتی، پایداری شبکه را ۱۰ برابر و راندمان را ۵ برابر افزایش میدهد.
رک NVL72 و سوپرپادها؛ کارخانه هوش مصنوعی در یک کابینت
تمام این ۶ قطعه سیلیکونی شگفتانگیز در نهایت درون یک شاسی واحد به نام NVIDIA Vera Rubin NVL72 تجمیع میشوند. این کابینت پردازشی، یک دیتاسنتر کامل در ابعاد یک رک است که ظرفیت حافظه LPDDR5x آن به ۵۴ ترابایت و پهنای باند شبکه Scale-Up آن به ۲۶۰ ترابایت بر ثانیه میرسد.
سازمانهایی که نیازمند زیرساختهای عظیم هستند، میتوانند به سراغ پلتفرم DGX SuperPOD بروند که ترکیبی از ۸ رک NVL72 است. غولهای تولیدکننده تجهیزات شبکه و دیتاسنتر نظیر دل (Dell)، اچپیای (HPE)، لنوو و ایسوس هماکنون خطوط تولید خود را برای مونتاژ این سیستمها آماده کردهاند و تحویل آنها تا اواخر سال جاری میلادی آغاز خواهد شد.
جدول مقایسهای: معماری Blackwell در برابر Vera Rubin
برای درک عظمت پلتفرم جدید انویدیا، مقایسه نسل قبلی با پلتفرم فعلی در سطح رک NVL72 به شدت گویاست:
| شاخص عملکردی / سختافزاری | معماری Blackwell (GB200) | معماری Vera Rubin (NVL72) |
|---|---|---|
| عملکرد استنتاج (Inference) | ۱ برابر (مبنا) | ۵ برابر ارتقا (۳.۶ اگزافلاپس) |
| عملکرد آموزش مدل (Training) | ۱ برابر (مبنا) | ۳.۵ برابر ارتقا (۲.۵ اگزافلاپس) |
| ظرفیت حافظه پرسرعت HBM | حدود ۸ ترابایت | ۲۰.۷ ترابایت (نسل HBM4) |
| پهنای باند ارتباطی درونرکی | ۱۳۰ ترابایت بر ثانیه | ۲۶۰ ترابایت بر ثانیه (Scale-Up) |
| فناوری شبکه | سوئیچهای NVLink 5 | NVLink 6 + فوتونیک سیلیکونی (نوری) |
تحلیل اختصاصی آلفاتک: انقلاب در کاهش هزینههای زیرساخت AI
با معرفی پلتفرم Vera Rubin، استراتژی انویدیا از “فروش کارت گرافیک” به “توسعه کارخانههای هوش مصنوعی” تغییر یافته است. بر اساس آمارهای منتشر شده، معماری Rubin باعث کاهش ۱۰ برابری هزینه تولید هر توکن در استنتاج و کاهش چشمگیر در تعداد پردازندههای مورد نیاز برای آموزش مدلهای MoE (مخلوطی از خبرگان) شده است. این موضوع برای ارائهدهندگان خدمات ابری (Cloud Providers) حیاتی است؛ چرا که اکنون میتوانند با مصرف برق کمتر و فضای رک کوچکتر، توان پردازشی به مراتب بالاتری را به مشتریان خود ارائه دهند. انویدیا با ورود جدی به عرصه CPU (با مدل Vera)، در حال تکمیل اکوسیستم اختصاصی خود است تا دیتاسنترها دیگر نیازی به خرید پردازندههای x86 از اینتل یا AMD نداشته باشند.


