در عصری هستیم که حتی قطعی چند ثانیه‌ای زیرساخت‌های IT می‌تواند خسارت‌های مالی و اعتباری بزرگی به بار بیاورد. سرورها، تجهیزات ذخیره‌سازی، و اجزای شبکه در هر ثانیه، حجم زیادی از اطلاعات را ذخیره، پردازش و مدیریت می‌کنند و قطعی برق، فاجعه‌بارترین چالش برای آن‌ها است. 

در ایران، وضعیت وخیم‌تر است و با قطعی‌های برق برنامه‌ریزی شده و برنامه‌ریزی نشده ی مکرری روبرو هستیم که یک بحران بزرگ برای سرویس‌های آنلاین، دسترسی به اینترنت و زیرساخت‌های حیاتی بانکی، مالی و تبادل اطلاعات به وجود آورده است. 

تیم‌های پشتیبانی آی تی در ایران، باید مانع از قطعی برق ناشی از خطاها و خرابی‌های داخلی شوند؛ و علاوه بر آن باید راهکارها و استراتژی‌هایی برای ادامه حیات اتاق سرور و تجهیزات شبکه در هنگام قطعی برق شهری سراسری داشته باشند. این مقاله، به بررسی استراتژی‌ها و فناوری‌های مختلفی می‌پردازد که می‌توانند جلوگیری از قطعی برق اتاق‌های سرور و دیتاسنتر را تضمین کنند.

انـــواع دلایــــل قطعــــی برق در دیتاسنترها

عموما برق تجهیزات شبکه در یک اتاق سرور یا مرکز داده به یکی از ۴ دلیل زیر، قطع می‌شود:

۱- خطای انسانی

تعمیرات اشتباهی، نگهداری یا برنامه‌ریزی ضعیف و حتی قطعی برق تصادفی که مستقیما ناشی از خطای انسانی است.

۲- بلایای طبیعی

حوادثی مانند زلزله، طوفان، سیل، انفجار و آتش‌سوزی می‌توانند برق شبکه سراسری یا برق دیتاسنتر را به طور اختصاصی قطع کنند.

۳- خرابی تجهیزات

زیرساخت‌های قدیمی، شبکه توزیع برق ضعیف، قطعات معیوب، بار کاری بیش از ظرفیت و نظایر این‌ها، خرابی قطعات و تجهیزات، و در نتیجه قطعی برق را در پی دارد.

۴- عوامل خارجی

حملات سایبری یا قطعی برق شبکه سراسری شهر نیز عواملی هستند که باعث از کار افتادن یک دیتاسنتر می‌شوند.

مدیران مرکزداده باید از هریک از دلایل قطعی برق که در بالا به آن ها اشاره شد، درک درستی داشته و برای تامین انرژی هر کدام، سناریوهای جایگزین سریعی داشته باشند.

۱۰ ترفند رایج برای جلوگیری از قطعی برق دیتاسنتر

در سال ۲۰۲۵، راهکارهای زیادی برای تامین برق دیتاسنترها وجود دارد و ما اینجا به ۱۰ مورد آن اشاره می‌کنیم:

۱- سرمایه‌گذاری روی سیستم‌های برق اضطراری

افزونگی یک مسئله حیاتی در طراحی مرکزداده است. سیستم‌های برق اضطراری، کارایی بدون وقفه مرکزداده را حتی در صورت خرابی منبع برق اصلی، تضمین می‌کند. بسیاری از اپراتورهای طراح دیتاسنتر، از دو منبع تغذیه جداگانه (ولی پشتیبان یکدیگر) برای تامین برق بخش‌های مختلف استفاده می‌کنند تا خطر کامل قطعی برق را به حداقل برساند. شرکت‌ها نیاز دارند روی سیستم‌های برق افزونه سرمایه‌گذاری جدی داشته باشند تا از بروز آسیب‌های جدی جلوگیری شود. استفاده از طراحی Redundant برای برق ورودی و توزیع داخلی (مانند A+B Power Feeds برای رک‌ها) و همچنین تامین برق سرور از دو منبع جداگانه، ترفندهای موثری است که مانع از خاموشی تجهیزات می‌شود.

۲- نگهداری، تعمیر و تست منظم

اگر می‌خواهید بابت خرابی و قطعی برق تجهیزات خیالتان راحت باشد؛ باید سرویس‌های تعمیر و نگهداری منظم و دوره‌ای استاندارد را برای تجهیزات شبکه اجرا کنید. بازرسی‌ها و ممیزی‌های برنامه‌ریزی شده از سیستم‌های الکتریکی، ژنراتورها، واحدهای باتری و یوپی‌اس‌ها می‌تواند مشکلات احتمالی را پیش از جدی شدن، شناسایی و رفع کند. 

در دیتاسنترهای حرفه‌ای، بارها و بارها باید ظرفیت سیستم‌های برق را به طور منظم مورد تست قرار داد تا مطمئن شویم می‌توانند نیازهای واقعی دیتاسنتر را تامین کنند.

باتری‌ها و یوپی‌اس‌ها نیز نقشی مهم و انکارناپذیر در اتاق‌های سرور دارند و باید به مدت شارژ، طول عمر و کارایی صحیح آن‌ها نظارت داشت و به طور دوره‌ای تعویض شوند یا ظرفیت آن‌ها ارتقا پیدا کند.

همه این موارد نیازمند یک برنامه دقیق نگهداری است تا مشکلات زودتر تشخیص داده شده و اختلالات برق به حداقل برسد.

۳- پیاده‌سازی سیستم‌های نظارتی

مانیتورینگ، بینشی آنی درباره کارایی سیستم‌های برق دیتاسنترها ارائه می‌کند. باز هم شرکت‌ها نیاز دارند روی راهکارهای نظارتی و مانیتورینگ، سرمایه‌گذاری کرده و فناوری‌های پیشرفته و حتی ترکیب شده با هوش مصنوعی را به خدمت بگیرند. شما نیاز دارید در لحظه بدانید سیستم شما چقدر برق مصرف می‌کند و کدام بخش‌ها، مصرفی بالاتر از انتظار و احتمالا دارای مشکلات ناکارآمدی هستند. محصولات مانیتورینگ فقط برای نظارت بر مصرف برق نیستند و دما، رطوبت، اتفاقات غیرمنتظره و رفتارهای غیرعادی تجهیزات و بخش‌های مختلف را رصد کرده و به مدیران شبکه هشدار می‌دهند.

۴- ژنراتور پشتیبان

امروزه، حتی در مدرن‌ترین دیتاسنترها هنوز از ژنراتورهای برق به عنوان یک جز ضروری استراتژی مدیریت برق قوی استفاده می‌شود. ژنراتورها در دیتاسنترهای ایرانی نیز نقش پررنگ و اساسی دارند و در قطعی‌های برق سراسری، می‌توانند سریعا وارد مدار شده و اجازه ندهند حتی برای چند ثانیه، بخشی از دیتاسنتر به خاموشی برود. در هنگام انتخاب یک ژنراتور پشتیبان باید در نظر بگیرید که چه ظرفیتی در حال و آینده نیاز دارید و براساس آن یک یا چند ژنراتور خریداری و نصب کنید. اینکه ژنراتور شما دیزلی، گازی یا از سوخت‌های دیگر تامین می‌شود؛ باز مسئله بسیار مهمی است. هزینه‌ها و اینکه چه سوخت‌هایی در دسترس شما است؛ باز هم روی به کارگیری ژنراتورهای مختلف، تاثیرگذار است. مثلا، در سال‌های اخیر در برخی دیتاسنترهای پیشرفته اروپایی از ژنراتورهای با سوخت هیدروژنی یا ژنراتورهای با نیروی هسته‌ای استفاده می‌شود. 

در پیکربندی و نصب ژنراتور هم باید حتما سوئیچ انتقال خودکار (ATS) بین برق شهری و ژنراتور در نظر گرفته شود.

۵- راهکارهای خنک‌کننده مناسب

پاشنه آشیل برق دیتاسنترها، سیستم‌های سرمایش هستند. خنک‌کننده مرکزداده می‌تواند باعث قطعی برق شود و از آن سو، قطعی برق می‌تواند باعث افزایش گرما در محیط و بعد خرابی خنک‌کننده شود. بنابراین، بهینه‌سازی سیستم سرمایش و حفظ دمای عملیاتی محیط در منطقه امن، هنگامی که با قطعی برق مواجه می‌شوید؛ بسیار ضروری است. استفاده از راهکارهایی مانند راهروهای هوای گرم/ سرد (Hot Aisle/Cold Aisle) به مدیریت موثر جریان هوا کمک می‌کنند و ضمن اینکه هوای سرد به سوی تجهیزات هدایت می‌شود؛ هوای گرم به طور موثری به بیرون از محیط اتاق سرور یا رک‌ها جریان یافته و دمای مناسب، تثبیت می‌شود. راهکارهای مدرن سیستم سرمایشی مانند خنک‌سازی روی تراشه، غوطه‌وری در مایع خنک، و حتی سیستم سرمایشی In-Rack نیز می‌توانند به حفظ دما در مناطق بحرانی در زمان قطعی برق، کمک کنند. 

۶- تست‌های ارزیابی خطر

ارزیابی خطر یا  risk assessment شامل کشف آسیب‌پذیری‌های بالقوه در مرکزداده است و یکی از حیاتی‌ترین اقداماتی است که باید برای جلوگیری از قطعی برق انجام گیرد. این فرآیند شامل موارد زیر می‌شود:

شناسایی سیستم‌های حیاتی: کشف سیستم‌هایی که به بالاترین سطح حفاظت از نظر برق‌رسانی نیاز دارند.

ارزیابی زیرساخت فعلی: شناسایی نقاط ضعف در زیرساخت برق فعلی مرکزداده و یافتن زمینه‌های بهبود.

توسعه برنامه‌های احتمالی: طرح‌ریزی برنامه‌های روشن و شفاف برای پاسخ‌گویی به سناریوهای مختلف از جمله قطع برق.

به طور کلی، ارزیابی ریسک به تصمیم‌گیری‌های مهم و موثر کمک می‌کند تا تلاش‌ها به سوی جلوگیری از قطعی برق هدایت شوند.

۷- آموزش کارمندان درباره رویه‌های اضطراری

داشتن کارمندان آموزش دیده‌ای که در هنگام قطعی برق، واکنش‌های موثر و درستی داشته باشند؛ نیاز ضروری دیگری در اتاق‌های سرور و دیتاسنتر است. مدیران سیستم باید پروتکل‌های واکنش اضطراری را نوشته و کارمندان درباره آن‌ها کامل توجیه شده باشند. این پروتکل‌ها نحوه کار با منابع انرژی پشتیبان یا خاموش کردن تجهیزات به صورت امن را تشریح کرده اند.

ضمنا باید مانورها و تمرین‌های منظمی برای شبیه‌سازی بحران قطعی برق پیاده‌سازی کنید تا کارمندان شما مرتبا به‌روزرسانی و ورزیده‌تر شوند و بدانند در هنگام قطعی برق، چه واکنش‌های آنی باید داشته باشند.

۸- سرمایه‌گذاری روی منابع انرژی تجدیدپذیر

امروزه، کمتر دیتاسنتر مدرنی در جهان یافت می‌شود که از انرژی باد و خورشید یا انرژی‌های هسته‌ای برای تامین برق تجهیزات شبکه خود استفاده نکند. سرمایه‌گذاری روی انرژی‌های تجدیدپذیر، ضمن اینکه وابستگی دیتاسنتر به برق شهری را به شدت کاهش می‌دهد و تاثیرپذیری از ناپایداری سیستم شبکه توزیع برق را به حداقل می‌رساند؛ تاب‌آوری سیستم در برابر قطعی برق را نیز افزایش خواهد داد. در ایران، متاسفانه، این موضوع به دلایل زیادی از جمله تحریم‌ها، هزینه‌های بالا و مدیریت ناکارآمد، مورد غفلت واقع شده و اکنون غالب دیتاسنترهای دولتی، وابستگی ۱۰۰ درصدی به برق شهری دارند. نصب پنل‌های خورشیدی و تاسیس نیروگاه‌های انرژی خورشیدی، حتی با ظرفیت‌های پایین، یکی از ضروری‌ترین نیازهای مراکزداده بزرگ ایرانی است. ترکیب سیستم‌های انرژی تجدیدپذیر با باتری‌ها، امکان ذخیره انرژی در زمان اوج مصرف و استفاده از آن در زمان قطعی برق را فراهم می‌کند.

۹- قرارداد تامین برق صنعتی و خصوصی

چالش کمبود برق نه تنها برای ایران بلکه در سایر کشورها نیز مطرح است. در برخی مناطق، امکان خرید برق از نیروگاه‌های خصوصی (مانند CHP یا خورشیدی) وجود دارد.  این راهکار در صورت امکان، می‌تواند وابستگی به شبکه برق سراسری را کاهش دهد. هم‌اکنون، در بسیاری از کشورهای اروپایی از این امکان برای تامین برق در تابستان‌ها و زمان‌هایی که اوج مصرف انرژی است؛ استفاده می‌شود.

۱۰- استفاده از یوپی‌اس‌های با زمان پشتیبانی بالا

یو‌پی‌اس‌ها خط اول دفاع در برابر قطع ناگهانی برق هستند. استفاده از یوپی‌اس‌های آنلاین با باتری‌های لیتیومی یا VRLA با ظرفیت بالا، برای پوشش حداقل ۱۵ تا ۳۰ دقیقه (تا زمان راه‌اندازی ژنراتور) بسیار موثر واقع خواهد شد. UPS با زمان پشتیبانی بالا، یکی از ارکان حیاتی پایداری برق در دیتاسنترها است؛ مخصوصا در کشورهایی مثل ایران که قطعی برق می‌تواند طولانی و بدون هشدار باشد. ژنراتورها معمولا بین ۱۰ تا ۳۰ ثانیه زمان نیاز دارند تا روشن و بار را به‌طور کامل تحویل بگیرند. یک UPS با زمان پشتیبانی بالا (مثلاً ۳۰ دقیقه تا ۱ ساعت) تضمین می‌کند که در این فاصله هیچ اختلالی در سیستم به وجود نمی‌آید. ضمن اینکه اگر قطعی برق بیشتر از توان ژنراتور باشد؛ یو پی اس با زمان پشتیبانی بالا، این فرصت را می‌دهد تا سیستم‌ها به‌صورت ایمن و بدون آسیب، خاموش شوند. 

مشکل دیگر این است که در ایران گاها با نوسانات یا قطعی‌های چند ثانیه‌ای مکرر مواجه هستیم. یو‌پی‌اس‌های با ظرفیت بالا حتی بدون ژنراتور هم می‌تواند این لحظات بحرانی را مدیریت کند و از ریست شدن سرورها یا سوختن پاورهای حساس جلوگیری کند.