چالش مصرف انرژی در دیتاسنترها؛ تکنیکهای کاهش هزینههای نگهداری تجهیزات
- کنترل شاخص PUE: اندازهگیری و بهبود مداوم نسبت توان مصرفی کل به توان مصرفی تجهیزات IT جهت جلوگیری از هدررفت انرژی.
- مهار حرارتی (Containment): ایزوله کردن راهروهای سرد و گرم برای افزایش ۳۰ درصدی راندمان سیستمهای سرمایشی (CRAC).
- شکار سرورهای زامبی: شناسایی و خاموش کردن سرورهایی که پردازشی انجام نمیدهند اما برق مصرف میکنند (Consolidation).
- پروفایلهای مدیریت توان: فعالسازی تکنیکهای Power Capping در سطح BIOS سرورها برای کنترل حداکثر توان مصرفی در زمانهای اوج بار.
- مدرنسازی زیرساخت: جایگزینی سختافزارهای قدیمی با تجهیزات نسل جدید که عملکرد به ازای هر وات (Performance per Watt) بالاتری دارند.
آیا قبض برق دیتاسنتر شما به یک بحران مالی در سازمان تبدیل شده است؟ در بسیاری از زیرساختهای فناوری اطلاعات، بودجهای که صرف خنکسازی و تامین برق تجهیزات شبکه و دیتاسنتر میشود، گاهی از هزینه خرید خود سختافزارها فراتر میرود. اما فاجعه اصلی تنها در ارقام قبض برق خلاصه نمیشود؛ حرارت مدیریتنشده ناشی از مصرف بیرویه انرژی، قاتل خاموش قطعات گرانقیمت شماست. افزایش مداوم دما باعث استهلاک زودرس پردازندهها، خرابی درایوهای ذخیرهسازی و افت شدید راندمان (Thermal Throttling) میشود.
خوشبختانه، برای حل چالش مصرف انرژی در دیتاسنترها، نیازی به خاموش کردن سرویسهای حیاتی نیست. با پیادهسازی تکنیکهای مهندسی در لایههای فیزیکی، سرمایشی و پیکربندی سختافزار، میتوان هزینههای عملیاتی (OPEX) را به شکل چشمگیری کاهش داد. در این مقاله، کاربردیترین استراتژیها برای تبدیل یک دیتاسنتر پرمصرف به یک زیرساخت سبز و بهینه را بررسی میکنیم.
شاخص PUE؛ قطبنمای شما در اقیانوس مصرف انرژی
قبل از اینکه بتوانید چیزی را بهبود ببخشید، باید بتوانید آن را اندازهگیری کنید. اثربخشی مصرف انرژی (PUE – Power Usage Effectiveness) مهمترین شاخص در صنعت دیتاسنتر است. این عدد از تقسیم «کل برق ورودی به دیتاسنتر» بر «برق مصرفی تجهیزات IT (سرورها، سوییچها و استوریجها)» به دست میآید.
اگر PUE دیتاسنتر شما روی عدد ۲.۰ قرار دارد، به این معناست که برای هر یک واتی که سرورهای شما مصرف میکنند، یک وات دیگر صرف خنککننده، روشنایی و تلفات UPS میشود! شرکتهای پیشرو با تکنیکهای مدرن این عدد را به نزدیک ۱.۲ رساندهاند. هدفگذاری برای کاهش PUE، اولین قدم برای مسدود کردن نشتیهای مالی در واحد IT است.
انقلاب در سرمایش؛ از راهروهای محصور تا خنککنندههای مایع
سیستمهای خنککننده سنتی که هوای سرد را در تمام فضای اتاق سرور پخش میکنند، به شدت ناکارآمد هستند. هوای سرد پیش از رسیدن به سرورها با هوای گرم خروجی ترکیب میشود و راندمان افت میکند. راهکار مهندسی برای این مشکل، ایجاد راهروهای محصور (Aisle Containment) است.
با تفکیک فیزیکی راهروی سرد (Cold Aisle) از راهروی گرم (Hot Aisle) با استفاده از پنلها و درهای شیشهای، هوای سرد مستقیماً و با فشار به ورودی سرورها هدایت میشود و هوای گرم بدون ترکیب شدن، به سیستمهای مکنده (CRAC) برمیگردد. در دیتاسنترهای مدرنتر با چگالی پردازشی بالا (مانند کلاسترهای هوش مصنوعی)، استفاده از خنککنندههای مایع (Liquid Cooling) که مستقیماً حرارت را از روی پردازنده دفع میکنند، در حال تبدیل شدن به یک استاندارد است.
بهینهسازی در لایه سختافزار؛ شکار زامبیها و تراکم مجازیسازی
بر اساس گزارشهای صنعتی، حدود ۱۵ تا ۲۰ درصد از سرورهای نصب شده در دیتاسنترها، «سرورهای زامبی» هستند. یعنی روشن هستند، برق مصرف میکنند، اما هیچ بار کاری مفیدی (Workload) را پردازش نمیکنند. شناسایی و خاموش کردن این تجهیزات سرگردان، سریعترین راه برای کاهش هزینههاست.
همچنین، یک سرور فیزیکی که تنها با ۱۵ درصد ظرفیت خود کار میکند، از نظر انرژی به هیچ وجه بهینه نیست. با پیادهسازی حداکثری مجازیسازی (Virtualization) و تجمیع سرورها (Consolidation)، میتوانید بار کاری ۱۰ سرور قدیمی را روی ۲ سرور قدرتمند جدید (مانند HPE DL380) منتقل کنید. این کار نه تنها مصرف برق را به شدت کاهش میدهد، بلکه هزینههای لایسنس و فضای رک را نیز آزاد میکند.
جدول مقایسهای: دیتاسنتر سنتی در برابر دیتاسنتر بهینهشده
تفاوت بین یک زیرساخت رها شده و یک زیرساخت مهندسیشده در پارامترهای زیر کاملاً مشهود است:
| پارامتر ارزیابی | دیتاسنتر سنتی (نسل قدیم) | دیتاسنتر بهینهشده (مدرن) |
|---|---|---|
| شاخص PUE | ۲.۰ تا ۲.۵ (هدررفت بالای ۵۰٪) | ۱.۲ تا ۱.۵ (بسیار کارآمد) |
| معماری سرمایش | خنکسازی کل اتاق (Room-Based) | محصورسازی راهروها (Containment) یا Liquid Cooling |
| ضریب بهرهوری سرورها | ۱۰٪ تا ۲۰٪ (سختافزارهای فیزیکی پراکنده) | ۶۰٪ تا ۸۰٪ (محیط کاملاً مجازیسازی شده) |
| مدیریت توان (Power Management) | ثابت و بدون کنترل در بایوس | داینامیک و مبتنی بر Power Capping |
| طول عمر قطعات حساس | متوسط رو به پایین (به دلیل نوسان حرارتی) | حداکثر طول عمر استاندارد |
تحلیل اختصاصی آلفاتک: چرا مدیریت انرژی مساوی با طول عمر سختافزار است؟
کارشناسان زیرساخت در آلفاتک همواره به مدیران IT یک نکته طلایی را یادآوری میکنند: در شرایط اقتصادی فعلی و قیمت نجومی تجهیزات سختافزاری در ایران، هدف از بهینهسازی مصرف انرژی، صرفاً کاهش مبلغ قبض برق نیست. هر یک درجه سانتیگراد کاهش در دمای محیطِ سرورها، به معنای کاهش استهلاک خازنهای مادربرد، افزایش طول عمر درایوهای گرانقیمت NVMe و جلوگیری از سوختگی ناگهانی پاورهاست. سرمایهگذاری روی سیستمهای مانیتورینگ دما و چیدمان اصولی رکها، در واقع بیمه کردن داراییهای چند میلیاردی سازمان در برابر مرگ زودرس حرارتی است.


