در عصری هستیم که حتی قطعی چند ثانیهای زیرساختهای IT میتواند خسارتهای مالی و اعتباری بزرگی به بار بیاورد. سرورها، تجهیزات ذخیرهسازی، و اجزای شبکه در هر ثانیه، حجم زیادی از اطلاعات را ذخیره، پردازش و مدیریت میکنند و قطعی برق، فاجعهبارترین چالش برای آنها است.
در ایران، وضعیت وخیمتر است و با قطعیهای برق برنامهریزی شده و برنامهریزی نشده ی مکرری روبرو هستیم که یک بحران بزرگ برای سرویسهای آنلاین، دسترسی به اینترنت و زیرساختهای حیاتی بانکی، مالی و تبادل اطلاعات به وجود آورده است.
تیمهای پشتیبانی آی تی در ایران، باید مانع از قطعی برق ناشی از خطاها و خرابیهای داخلی شوند؛ و علاوه بر آن باید راهکارها و استراتژیهایی برای ادامه حیات اتاق سرور و تجهیزات شبکه در هنگام قطعی برق شهری سراسری داشته باشند. این مقاله، به بررسی استراتژیها و فناوریهای مختلفی میپردازد که میتوانند جلوگیری از قطعی برق اتاقهای سرور و دیتاسنتر را تضمین کنند.
انـــواع دلایــــل قطعــــی برق در دیتاسنترها
عموما برق تجهیزات شبکه در یک اتاق سرور یا مرکز داده به یکی از ۴ دلیل زیر، قطع میشود:
۱- خطای انسانی
تعمیرات اشتباهی، نگهداری یا برنامهریزی ضعیف و حتی قطعی برق تصادفی که مستقیما ناشی از خطای انسانی است.
۲- بلایای طبیعی
حوادثی مانند زلزله، طوفان، سیل، انفجار و آتشسوزی میتوانند برق شبکه سراسری یا برق دیتاسنتر را به طور اختصاصی قطع کنند.
۳- خرابی تجهیزات
زیرساختهای قدیمی، شبکه توزیع برق ضعیف، قطعات معیوب، بار کاری بیش از ظرفیت و نظایر اینها، خرابی قطعات و تجهیزات، و در نتیجه قطعی برق را در پی دارد.
۴- عوامل خارجی
حملات سایبری یا قطعی برق شبکه سراسری شهر نیز عواملی هستند که باعث از کار افتادن یک دیتاسنتر میشوند.
مدیران مرکزداده باید از هریک از دلایل قطعی برق که در بالا به آن ها اشاره شد، درک درستی داشته و برای تامین انرژی هر کدام، سناریوهای جایگزین سریعی داشته باشند.
۱۰ ترفند رایج برای جلوگیری از قطعی برق دیتاسنتر
در سال ۲۰۲۵، راهکارهای زیادی برای تامین برق دیتاسنترها وجود دارد و ما اینجا به ۱۰ مورد آن اشاره میکنیم:
۱- سرمایهگذاری روی سیستمهای برق اضطراری
افزونگی یک مسئله حیاتی در طراحی مرکزداده است. سیستمهای برق اضطراری، کارایی بدون وقفه مرکزداده را حتی در صورت خرابی منبع برق اصلی، تضمین میکند. بسیاری از اپراتورهای طراح دیتاسنتر، از دو منبع تغذیه جداگانه (ولی پشتیبان یکدیگر) برای تامین برق بخشهای مختلف استفاده میکنند تا خطر کامل قطعی برق را به حداقل برساند. شرکتها نیاز دارند روی سیستمهای برق افزونه سرمایهگذاری جدی داشته باشند تا از بروز آسیبهای جدی جلوگیری شود. استفاده از طراحی Redundant برای برق ورودی و توزیع داخلی (مانند A+B Power Feeds برای رکها) و همچنین تامین برق سرور از دو منبع جداگانه، ترفندهای موثری است که مانع از خاموشی تجهیزات میشود.
۲- نگهداری، تعمیر و تست منظم
اگر میخواهید بابت خرابی و قطعی برق تجهیزات خیالتان راحت باشد؛ باید سرویسهای تعمیر و نگهداری منظم و دورهای استاندارد را برای تجهیزات شبکه اجرا کنید. بازرسیها و ممیزیهای برنامهریزی شده از سیستمهای الکتریکی، ژنراتورها، واحدهای باتری و یوپیاسها میتواند مشکلات احتمالی را پیش از جدی شدن، شناسایی و رفع کند.
در دیتاسنترهای حرفهای، بارها و بارها باید ظرفیت سیستمهای برق را به طور منظم مورد تست قرار داد تا مطمئن شویم میتوانند نیازهای واقعی دیتاسنتر را تامین کنند.
باتریها و یوپیاسها نیز نقشی مهم و انکارناپذیر در اتاقهای سرور دارند و باید به مدت شارژ، طول عمر و کارایی صحیح آنها نظارت داشت و به طور دورهای تعویض شوند یا ظرفیت آنها ارتقا پیدا کند.
همه این موارد نیازمند یک برنامه دقیق نگهداری است تا مشکلات زودتر تشخیص داده شده و اختلالات برق به حداقل برسد.
۳- پیادهسازی سیستمهای نظارتی
مانیتورینگ، بینشی آنی درباره کارایی سیستمهای برق دیتاسنترها ارائه میکند. باز هم شرکتها نیاز دارند روی راهکارهای نظارتی و مانیتورینگ، سرمایهگذاری کرده و فناوریهای پیشرفته و حتی ترکیب شده با هوش مصنوعی را به خدمت بگیرند. شما نیاز دارید در لحظه بدانید سیستم شما چقدر برق مصرف میکند و کدام بخشها، مصرفی بالاتر از انتظار و احتمالا دارای مشکلات ناکارآمدی هستند. محصولات مانیتورینگ فقط برای نظارت بر مصرف برق نیستند و دما، رطوبت، اتفاقات غیرمنتظره و رفتارهای غیرعادی تجهیزات و بخشهای مختلف را رصد کرده و به مدیران شبکه هشدار میدهند.
۴- ژنراتور پشتیبان
امروزه، حتی در مدرنترین دیتاسنترها هنوز از ژنراتورهای برق به عنوان یک جز ضروری استراتژی مدیریت برق قوی استفاده میشود. ژنراتورها در دیتاسنترهای ایرانی نیز نقش پررنگ و اساسی دارند و در قطعیهای برق سراسری، میتوانند سریعا وارد مدار شده و اجازه ندهند حتی برای چند ثانیه، بخشی از دیتاسنتر به خاموشی برود. در هنگام انتخاب یک ژنراتور پشتیبان باید در نظر بگیرید که چه ظرفیتی در حال و آینده نیاز دارید و براساس آن یک یا چند ژنراتور خریداری و نصب کنید. اینکه ژنراتور شما دیزلی، گازی یا از سوختهای دیگر تامین میشود؛ باز مسئله بسیار مهمی است. هزینهها و اینکه چه سوختهایی در دسترس شما است؛ باز هم روی به کارگیری ژنراتورهای مختلف، تاثیرگذار است. مثلا، در سالهای اخیر در برخی دیتاسنترهای پیشرفته اروپایی از ژنراتورهای با سوخت هیدروژنی یا ژنراتورهای با نیروی هستهای استفاده میشود.
در پیکربندی و نصب ژنراتور هم باید حتما سوئیچ انتقال خودکار (ATS) بین برق شهری و ژنراتور در نظر گرفته شود.
۵- راهکارهای خنککننده مناسب
پاشنه آشیل برق دیتاسنترها، سیستمهای سرمایش هستند. خنککننده مرکزداده میتواند باعث قطعی برق شود و از آن سو، قطعی برق میتواند باعث افزایش گرما در محیط و بعد خرابی خنککننده شود. بنابراین، بهینهسازی سیستم سرمایش و حفظ دمای عملیاتی محیط در منطقه امن، هنگامی که با قطعی برق مواجه میشوید؛ بسیار ضروری است. استفاده از راهکارهایی مانند راهروهای هوای گرم/ سرد (Hot Aisle/Cold Aisle) به مدیریت موثر جریان هوا کمک میکنند و ضمن اینکه هوای سرد به سوی تجهیزات هدایت میشود؛ هوای گرم به طور موثری به بیرون از محیط اتاق سرور یا رکها جریان یافته و دمای مناسب، تثبیت میشود. راهکارهای مدرن سیستم سرمایشی مانند خنکسازی روی تراشه، غوطهوری در مایع خنک، و حتی سیستم سرمایشی In-Rack نیز میتوانند به حفظ دما در مناطق بحرانی در زمان قطعی برق، کمک کنند.
۶- تستهای ارزیابی خطر
ارزیابی خطر یا risk assessment شامل کشف آسیبپذیریهای بالقوه در مرکزداده است و یکی از حیاتیترین اقداماتی است که باید برای جلوگیری از قطعی برق انجام گیرد. این فرآیند شامل موارد زیر میشود:
شناسایی سیستمهای حیاتی: کشف سیستمهایی که به بالاترین سطح حفاظت از نظر برقرسانی نیاز دارند.
ارزیابی زیرساخت فعلی: شناسایی نقاط ضعف در زیرساخت برق فعلی مرکزداده و یافتن زمینههای بهبود.
توسعه برنامههای احتمالی: طرحریزی برنامههای روشن و شفاف برای پاسخگویی به سناریوهای مختلف از جمله قطع برق.
به طور کلی، ارزیابی ریسک به تصمیمگیریهای مهم و موثر کمک میکند تا تلاشها به سوی جلوگیری از قطعی برق هدایت شوند.
۷- آموزش کارمندان درباره رویههای اضطراری
داشتن کارمندان آموزش دیدهای که در هنگام قطعی برق، واکنشهای موثر و درستی داشته باشند؛ نیاز ضروری دیگری در اتاقهای سرور و دیتاسنتر است. مدیران سیستم باید پروتکلهای واکنش اضطراری را نوشته و کارمندان درباره آنها کامل توجیه شده باشند. این پروتکلها نحوه کار با منابع انرژی پشتیبان یا خاموش کردن تجهیزات به صورت امن را تشریح کرده اند.
ضمنا باید مانورها و تمرینهای منظمی برای شبیهسازی بحران قطعی برق پیادهسازی کنید تا کارمندان شما مرتبا بهروزرسانی و ورزیدهتر شوند و بدانند در هنگام قطعی برق، چه واکنشهای آنی باید داشته باشند.
۸- سرمایهگذاری روی منابع انرژی تجدیدپذیر
امروزه، کمتر دیتاسنتر مدرنی در جهان یافت میشود که از انرژی باد و خورشید یا انرژیهای هستهای برای تامین برق تجهیزات شبکه خود استفاده نکند. سرمایهگذاری روی انرژیهای تجدیدپذیر، ضمن اینکه وابستگی دیتاسنتر به برق شهری را به شدت کاهش میدهد و تاثیرپذیری از ناپایداری سیستم شبکه توزیع برق را به حداقل میرساند؛ تابآوری سیستم در برابر قطعی برق را نیز افزایش خواهد داد. در ایران، متاسفانه، این موضوع به دلایل زیادی از جمله تحریمها، هزینههای بالا و مدیریت ناکارآمد، مورد غفلت واقع شده و اکنون غالب دیتاسنترهای دولتی، وابستگی ۱۰۰ درصدی به برق شهری دارند. نصب پنلهای خورشیدی و تاسیس نیروگاههای انرژی خورشیدی، حتی با ظرفیتهای پایین، یکی از ضروریترین نیازهای مراکزداده بزرگ ایرانی است. ترکیب سیستمهای انرژی تجدیدپذیر با باتریها، امکان ذخیره انرژی در زمان اوج مصرف و استفاده از آن در زمان قطعی برق را فراهم میکند.
۹- قرارداد تامین برق صنعتی و خصوصی
چالش کمبود برق نه تنها برای ایران بلکه در سایر کشورها نیز مطرح است. در برخی مناطق، امکان خرید برق از نیروگاههای خصوصی (مانند CHP یا خورشیدی) وجود دارد. این راهکار در صورت امکان، میتواند وابستگی به شبکه برق سراسری را کاهش دهد. هماکنون، در بسیاری از کشورهای اروپایی از این امکان برای تامین برق در تابستانها و زمانهایی که اوج مصرف انرژی است؛ استفاده میشود.
۱۰- استفاده از یوپیاسهای با زمان پشتیبانی بالا
یوپیاسها خط اول دفاع در برابر قطع ناگهانی برق هستند. استفاده از یوپیاسهای آنلاین با باتریهای لیتیومی یا VRLA با ظرفیت بالا، برای پوشش حداقل ۱۵ تا ۳۰ دقیقه (تا زمان راهاندازی ژنراتور) بسیار موثر واقع خواهد شد. UPS با زمان پشتیبانی بالا، یکی از ارکان حیاتی پایداری برق در دیتاسنترها است؛ مخصوصا در کشورهایی مثل ایران که قطعی برق میتواند طولانی و بدون هشدار باشد. ژنراتورها معمولا بین ۱۰ تا ۳۰ ثانیه زمان نیاز دارند تا روشن و بار را بهطور کامل تحویل بگیرند. یک UPS با زمان پشتیبانی بالا (مثلاً ۳۰ دقیقه تا ۱ ساعت) تضمین میکند که در این فاصله هیچ اختلالی در سیستم به وجود نمیآید. ضمن اینکه اگر قطعی برق بیشتر از توان ژنراتور باشد؛ یو پی اس با زمان پشتیبانی بالا، این فرصت را میدهد تا سیستمها بهصورت ایمن و بدون آسیب، خاموش شوند.
مشکل دیگر این است که در ایران گاها با نوسانات یا قطعیهای چند ثانیهای مکرر مواجه هستیم. یوپیاسهای با ظرفیت بالا حتی بدون ژنراتور هم میتواند این لحظات بحرانی را مدیریت کند و از ریست شدن سرورها یا سوختن پاورهای حساس جلوگیری کند.
دیدگاه خود را بنویسید