در یک سال گذشته، آمارهای آتشسوزی دیتاسنترها، افزایش قابل توجه و نگرانکنندهای داشته است. به گزارش موسسه آپتایم، از سال ۲۰۱۶ تا ۲۰۲۰ فقط ۱۳ مورد آتشسوزی دیتاسنتر گزارش شده است و در دو سال گذشته نیز حداقل ۴ مورد آتشسوزی و قطعی کامل دیتاسنتر داشتیم. چندین مورد آتشسوزی در دیتاسنترهای کشورهایی مانند ایالات متحده، انگلیس و کرهی جنوبی رخ داد. تابستان داغ گذشته، به طور مستقیم روی عملکرد مراکزداده تاثیرگذار بود و آتشسوزیها باعث بروز مشکلاتی در سرویسهای آنلاین شدند؛ صدها وبسایت و فروشگاه آنلاین از کار افتادند و دادههای کسبوکارها از بین رفت.
دلایل این آتشسوزیها متفاوت است. در یک مورد که برای مرکزدادهی Kakao در کرهی جنوبی رخ داد؛ باتری لیتیوم یونی واقع در اتاق کنترل برق، آتش گرفته و باعث قطع برق شد. در آوریل ۲۰۲۳ نیز مرکز دادهی شرکت مکسوند (Maxnod)فرانسه دچار حریق شد و باز هم پلیس گزارش داد نقض باتری در سیستمهای UPS دلیل شعلهور شدن آتش در رکهای یک اتاق و از کار افتادن کل مرکزداده، آسیب دیدن کابلهای فیبر نوری، اختلال گسترده در اینترنت، و سرویس FTTH خانگی شده است.
آتشسوزی در دیتاسنترها، علاوه بر اینکه باعث قطعی اینترنت و سرویس آنلاین میلیونها نفر میشود؛ تلفات جانی و ضررهای مالی شدیدی به همراه دارد. در ماه اوت، یکی از مراکزداده گوگل به دلیل انفجار الکتریکی، آتش گرفت و سه برقکار که در یک ایستگاه فرعی در نزدیکی این مرکزداده کار میکردند، مجروح شدند. در آتشسوزی مرکز دادهی سایبروان در جاکارتای اندونزی که دو سال پیش رخ داد؛ دو نفر جان خود را از دست دادند یا در آتشسوزی معروف مرکز دادهی OVHcloudدر استراسبورگ، علاوه بر آسیبهایی که به کارمندان و حتی آتشنشانان وارد شد؛ سرورهای پشتیبان OVH نیز که در همان مرکزداده نگهداری میشدند؛ مخدوش شده و دهها شرکت بر ضد آنها به دادگاه شکایت کرده و درخواست خسارت کردند.
مدیران مراکزداده باید وقوع آتشسوزی را جدی بگیرند و اقداماتی برای جلوگیری از بروز آن و محافظت از دادهها و تجهیزات در برابر آتش انجام دهند. در ادامه، سه گام یا اقدام مهم و ضروری در هر دیتاسنتر برای مقابله با آتشسوزی، مرور شده است:
بهترین رویکردها برای مقابله با خطرات آتشسوزی در مراکزداده
موسسهی آپتایم برای کاهش خطر آتشسوزی در یک دیتاسنتر، سه اقدام ویژه را به صورت توصیه ارائه کرده است:
- شناسایی (Detection): استفاده از سیستم VESDA (دستگاه تشخیص سریع دود)
- اطفاء حریق (Suppression): از سالم بودن سیستم اطفای حریق دیتاسنتر اطمینان حاصل کنید و مطمئن شوید به موقع کار میکند و میتواند آتشسوزی را مهار کند؛ حالا خواه مبتنی بر آب، گاز یا ترکیبی از هر دو باشد.
- کاهش آسیب (Mitigation): ارزیابیهای دورهای خطرپذیری را برای شناسایی و رسیدگی به عواملی که میتوانند در سیستم مشکل ایجاد کنند و باعث آتشسوزی شوند، جدی بگیرید و این ارزیابیها را مرتب انجام دهید.
«رایان اور» معاون خدمات توپولوژی موسسه آپتایم میگوید مراکزداده باید به طور وسیعی، سیستمهای پیشگیری و کاهش آتشسوزی داشته باشند؛ حتی فراتر از استانداردهای رایج و محلی که سراغ داریم.
او میگوید: «اگرچه امروزه پیشرفت قابل توجهی در استفاده از مواد اولیه با قابلیت اشتعال کم و کاهش خطر آتشسوزی در دیتاسنترها داریم و برای انتخاب مواد، دقت بسیار زیادی صورت میگیرد؛ باز هم مراکزداده همچنان متکی به تجهیزات و وسایلی هستند که بالقوه میتوانند شروعکنندهی یک آتشسوزی و شعلهور ساختن آن باشند. در صورت وقوع یک آتشسوزی، مرحلهی طراحی اطفای حریق خیلی مهم است و سپس در حین عملیات، لازم است همهی نکات ایمنی بهطور دقیقی رعایت شوند تا هم دادهها و هم نیروی انسانی و تجهیزات، کمترین آسیب را ببینند.»
«تشخیص و شناسایی»، اولین گام مهم در حفاظت از یک مرکزداده در برابر آتشسوزی است و گامهای بعدی، «اطفای حریق» و «کاهش آسیبها» است. در آتشسوزی مرکزدادهی OVH که باعث نابودی کامل و ۱۰۰ درصدی مرکزداده شد، برخی عوامل مانند فقدان یک سیستم اطفای حریق خودکار یا استفاده از یک سقف چوبی که فقط یک ساعت در برابر آتش مقاومت میکند؛ و همینطور دو حیاط داخلی که به نوعی دودکش آتش بودند و آن را بیشتر شعلهور کردند؛ نقش پررنگی داشتند.
داشتن یک پروتکل مدیریت بلایای طبیعی و بهروزرسانی مداوم آن برای هر دیتاسنتر حیاتی است. مرکز دادهی شرکت Kakao دارای یک پروتکل مدیریت بلایای طبیعی بود اما در این پروتکل، برای قطعی برق در هنگام بروز آتشسوزی، فکری نشده بود و همین موضوع، تلاش برای بازیابی و کاهش آسیبها را با کندی روبرو کرد. شرکت Kakao با درس گرفتن از این آتشسوزی، کمیتهای برای پیشگیری از حوادث مشابه راهاندازی کرد و اقداماتی برای جلوگیری از تکرار آن صورت داد.
اپراتورهای مرکزداده، علاوه بر اقدامات سه گانه «تشخیص»، «اطفای حریق» و «کاهش آسیب»، باید یک طرح و برنامهی قوی برای بازیابی بحرانی (disaster recovery) داشته باشند. این طرحِ بازیابی بحرانی باید شامل پشتیبانگیری، تکثیر دادهها (replication)، و فرآیندهای بازیابی به همراه رویههایی برای اطمینان از واکنش سریع و بازیابی فوری در هنگام وقوع یک حادثه باشد.
هنگامی که در دیتاسنتر Naver آتشسوزی رخ داد و سرویسهای آن کاملا قطع شدند؛ به دلیل داشتن یک نسخهی پشتیبان خارج از سایت، سریعا و در کمتر از چند ساعت، همهچیز بازیابی شده و به مدار بازگشتند. برعکس، شرکت Kakao در زمان آتشسوزی هیچگونه طرحی برای بازیابی در بلایای طبیعی یا سایت پشتیبان نداشت و سرویسهای آن برای چندین روز قطع شدند. هنگامی که مرکزدادهی اصلی Kakao کاملا بازیابی و عملیاتی شد، سریعا در مدت زمانی کمتر از دو ماه، یک سایت پشتیبان به صورت افزونهای از سایت اصلی ساخت تا از اختلالات مشابه، جلوگیری کند. کاکائو، در سال جاری بیش از ۳۰۰ میلیون دلار برای تکمیل مرکزدادهی خود هزینه میکند و ساخت یک مرکزدادهی دیگر برای سال ۲۰۲۴ را در دستور کار خود دارد.
دیدگاه خود را بنویسید