اتحاد تاریخی اینتل و AMD برای نجات x86: رونمایی از شتابدهنده هوش مصنوعی ACE
- جهش پردازشی: افزایش تراکم پردازشهای هوش مصنوعی تا $16\times$ (۱۶ برابر).
- قدرت عملیاتی: توانایی اجرای همزمان $1024$ عملیات ضرب ماتریسی در هر دستور.
- پشتیبانی بومی: سازگاری کامل با فرمتهای رایج AI شامل INT8، FP8 و BF16.
- پایان محدودیتها: گسترش استفاده از شتابدهندههای ماتریسی از لپتاپهای مصرفی تا دیتاسنترها.
- همگامسازی نرمافزاری: ادغام با فریمورکهای قدرتمندی نظیر PyTorch، TensorFlow، NumPy و SciPy.
در اتفاقی کمسابقه و تاریخی در صنعت فناوری، دو رقیب دیرینه یعنی اینتل (Intel) و ایامدی (AMD) برای حفظ بقای معماری x86 با یکدیگر متحد شدند. خروجی این همکاری، معرفی راهکاری قدرتمند تحت عنوان «افزونههای محاسباتی هوش مصنوعی» یا ACE (AI Computing Extensions) است؛ شتابدهندهای که با هدف افزایش چشمگیر توانایی پردازندهها در اجرای بارهای کاری هوش مصنوعی طراحی شده است.
گروه مشورتی اکوسیستم x86؛ اتحادی برای بقا در برابر ARM
معرفی ACE فراتر از یک رونمایی سختافزاری ساده است. این افزونه بخشی از تلاشهای «گروه مشورتی اکوسیستم x86» محسوب میشود که در سال ۲۰۲۴ با محوریت اینتل و AMD و با حضور غولهایی نظیر گوگل، مایکروسافت، متا و اوراکل شکل گرفت. با قدرتگیری روزافزون معماری ARM (مانند پردازندههای سری M اپل و تراشههای کوالکام)، معماری x86 در مقطع بسیار حساسی قرار گرفته است. هدف اصلی این ائتلاف، کاهش چندپارگی نرمافزاری، سادهسازی فرآیند توسعه و تضمین سازگاری صددرصدی کدهای مبتنی بر هوش مصنوعی در پلتفرمهای مختلف x86 است.
معماری و مشخصات فنی شتابدهنده ACE
از نظر فنی، ACE بهعنوان یک مکمل قدرتمند برای دستورالعملهای AVX10 عمل میکند. این شتابدهنده با استفاده از عملیات ریاضی موسوم به «ضرب خارجی» (Outer Product)، در هر دستور دو بردار ورودی را دریافت کرده و $1024$ عملیات ضرب را بهطور همزمان پردازش میکند. این معماری بازده محاسباتی را بهشدت بالا میبرد، بدون آنکه فشار اضافهای به رجیسترهای پردازنده وارد کند.
از آنجایی که ضرب ماتریسی گلوگاه اصلی در پردازش مدلهای یادگیری ماشین (ML) و مدلهای زبانی بزرگ (LLM) است، پشتیبانی بومی ACE از فرمتهای INT8، FP8 و BF16 مستقیماً این چالش را هدف قرار داده و باعث افزایش سرعت و بهینگی پردازش میشود.
تفاوت ACE با استانداردهای قبلی x86
یکی از بزرگترین مزیتهای ACE، حذف محدودیتهای پیشین است. فناوریهای گذشته مانند AMX تنها محدود به سرورها بودند، اما ACE قرار است استانداردی فراگیر برای تمام پلتفرمها باشد.
| ویژگیها | دستورالعمل AVX10 | فناوری Intel AMX | شتابدهنده جدید (ACE) |
|---|---|---|---|
| نوع پردازش غالب | پردازش برداری (Vector) | شتابدهنده ماتریسی (Matrix) | شتابدهنده ماتریسی یکپارچه (Matrix + Vector) |
| جامعه هدف سختافزاری | کلاینت و سرور | منحصر به سرورها و دیتاسنترها | فراگیر (از لپتاپهای مصرفی تا دیتاسنتر مقیاسبالا) |
| تراکم عملیات موازی | متوسط | بالا | بسیار بالا (تا $16\times$ تراکم بیشتر) |
| پشتیبانی نرمافزاری در x86 | استاندارد پایه | نیازمند کدهای اختصاصی اینتل | استاندارد مشترک و یکپارچه (AMD و Intel) |
تحلیل اختصاصی آلفاتک: اتحاد در استاندارد، رقابت در سیلیکون
بهگفتهی جنسن هوانگ (مدیرعامل انویدیا)، چنین همکاریهایی نقش تعیینکنندهای در حفظ جایگاه معماری x86 در آیندهای که حول محور AI میچرخد، ایفا خواهند کرد. با این حال، نباید تصور کرد که رقابت این دو شرکت به پایان رسیده است؛ اتحاد آنها صرفاً در سطح دستورالعملها و یکپارچگی نرمافزاری است تا برنامهنویسان نیازی به نوشتن کدهای جداگانه برای پردازندههای اینتل و AMD نداشته باشند. در بخش سختافزار، رقابت داغتر از همیشه است؛ AMD خود را برای رویداد Advancing AI 2026 آماده میکند و اینتل نیز در حال توسعه پردازندههای هیبریدی با ترکیب هستههای کلاسیک و شتابدهندههای هوش مصنوعی است.


