در یک سال گذشته، آمارهای آتش‌سوزی دیتاسنترها، افزایش قابل توجه و نگران‌کننده‌ای داشته است. به گزارش موسسه آپ‌تایم، از سال ۲۰۱۶ تا ۲۰۲۰ فقط ۱۳ مورد آتش‌سوزی دیتاسنتر گزارش شده است و در دو سال گذشته نیز حداقل ۴ مورد آتش‌سوزی و قطعی کامل دیتاسنتر داشتیم. چندین مورد آتش‌سوزی در دیتاسنترهای کشورهایی مانند ایالات متحده، انگلیس و کره­ی جنوبی رخ داد. تابستان داغ گذشته، به طور مستقیم روی عملکرد مراکزداده تاثیرگذار بود و آتش‌سوزی‌ها باعث بروز مشکلاتی در سرویس‌های آنلاین شدند؛ صدها وب‌سایت و فروشگاه آنلاین از کار افتادند و داده‌های کسب‌وکارها از بین رفت.

دلایل این آتش‌سوزی‌ها متفاوت است. در یک مورد که برای مرکزداده­ی Kakao در کره­ی جنوبی رخ داد؛ باتری لیتیوم یونی واقع در اتاق کنترل برق، آتش گرفته و باعث قطع برق شد. در آوریل ۲۰۲۳ نیز مرکز داده­ی شرکت مکسوند  (Maxnod)فرانسه دچار حریق شد و باز هم پلیس گزارش داد نقض باتری در سیستم‌های UPS دلیل شعله‌ور شدن آتش در رک‌های یک اتاق و از کار افتادن کل مرکزداده، آسیب دیدن کابل‌های فیبر نوری، اختلال گسترده در اینترنت، و سرویس FTTH خانگی شده است.

آتش‌سوزی در دیتاسنترها، علاوه بر اینکه باعث قطعی اینترنت و سرویس آنلاین میلیون‌ها نفر می‌شود؛ تلفات جانی و ضررهای مالی شدیدی به همراه دارد. در ماه اوت، یکی از مراکزداده گوگل به دلیل انفجار الکتریکی، آتش گرفت و سه برق‌کار که در یک ایستگاه فرعی در نزدیکی این مرکزداده کار می‌کردند، مجروح شدند. در آتش‌سوزی مرکز داده­ی سایبروان در جاکارتای اندونزی که دو سال پیش رخ داد؛ دو نفر جان خود را از دست دادند یا در آتش‌سوزی معروف مرکز داده­ی  OVHcloudدر استراسبورگ، علاوه بر آسیب‌هایی که به کارمندان و حتی آتش‌نشانان وارد شد؛ سرورهای پشتیبان OVH نیز که در همان مرکزداده نگهداری می‌شدند؛ مخدوش شده و ده‌ها شرکت بر ضد آن‌ها به دادگاه شکایت کرده و درخواست خسارت کردند.

مدیران مراکزداده باید وقوع آتش‌سوزی را جدی بگیرند و اقداماتی برای جلوگیری از بروز آن و محافظت از داده‌ها و تجهیزات در برابر آتش انجام دهند. در ادامه، سه گام یا اقدام مهم و ضروری در هر دیتاسنتر برای مقابله با آتش‌سوزی، مرور شده است:

بهترین رویکردها برای مقابله با خطرات آتش‌سوزی در مراکزداده

موسسه­ی آپ­تایم برای کاهش خطر آتش‌سوزی در یک دیتاسنتر، سه اقدام ویژه را به صورت توصیه ارائه کرده است:

  • شناسایی (Detection): استفاده از سیستم VESDA (دستگاه تشخیص سریع دود)
  • اطفاء حریق (Suppression): از سالم بودن سیستم اطفای حریق دیتاسنتر اطمینان حاصل کنید و مطمئن شوید به موقع کار می‌کند و می‌تواند آتش‌سوزی را مهار کند؛ حالا خواه مبتنی بر آب، گاز یا ترکیبی از هر دو باشد.
  • کاهش آسیب (Mitigation): ارزیابی‌های دوره‌ای خطرپذیری را برای شناسایی و رسیدگی به عواملی که می‌توانند در سیستم مشکل ایجاد کنند و باعث آتش‌سوزی شوند، جدی بگیرید و این ارزیابی­ها را مرتب انجام دهید.

«رایان اور» معاون خدمات توپولوژی موسسه آپ­تایم می‌گوید مراکزداده باید به طور وسیعی، سیستم‌های پیش‌گیری و کاهش آتش‌سوزی داشته باشند؛ حتی فراتر از استانداردهای رایج و محلی که سراغ داریم.

او می‌گوید: «اگرچه امروزه پیشرفت قابل توجهی در استفاده از مواد اولیه با قابلیت اشتعال کم و کاهش خطر آتش‌سوزی در دیتاسنترها داریم و برای انتخاب مواد، دقت بسیار زیادی صورت می‌گیرد؛ باز هم مراکزداده همچنان متکی به تجهیزات و وسایلی هستند که بالقوه می‌توانند شروع‌کننده­ی یک آتش‌سوزی و شعله‌ور ساختن آن باشند. در صورت وقوع یک آتش‌سوزی، مرحله­ی طراحی اطفای حریق خیلی مهم است و سپس در حین عملیات، لازم است همه­ی نکات ایمنی به­طور دقیقی رعایت شوند تا هم داده‌ها و هم نیروی انسانی و تجهیزات، کمترین آسیب را ببینند.»

«تشخیص و شناسایی»، اولین گام مهم در حفاظت از یک مرکزداده در برابر آتش‌سوزی است و گام‌های بعدی، «اطفای حریق» و «کاهش آسیب‌ها» است. در آتش‌سوزی مرکزداده­ی OVH که باعث نابودی کامل و ۱۰۰ درصدی مرکزداده شد، برخی عوامل مانند فقدان یک سیستم اطفای حریق خودکار یا استفاده از یک سقف چوبی که فقط یک ساعت در برابر آتش مقاومت می‌کند؛ و همین‌طور دو حیاط داخلی که به نوعی دودکش آتش بودند و آن را بیشتر شعله‌ور کردند؛ نقش پررنگی داشتند.

داشتن یک پروتکل مدیریت بلایای طبیعی و به‌روزرسانی مداوم آن برای هر دیتاسنتر حیاتی است. مرکز داده­ی شرکت Kakao دارای یک پروتکل مدیریت بلایای طبیعی بود اما در این پروتکل، برای قطعی برق در هنگام بروز آتش‌سوزی، فکری نشده بود و همین موضوع، تلاش برای بازیابی و کاهش آسیب‌ها را با کندی روبرو کرد. شرکت Kakao با درس گرفتن از این آتش‌سوزی، کمیته‌ای برای پیش‌گیری از حوادث مشابه راه‌اندازی کرد و اقداماتی برای جلوگیری از تکرار آن صورت داد.

اپراتورهای مرکزداده، علاوه بر اقدامات سه گانه «تشخیص»، «اطفای حریق» و «کاهش آسیب»، باید یک طرح و برنامه­ی قوی برای بازیابی بحرانی (disaster recovery) داشته باشند. این طرحِ بازیابی بحرانی باید شامل پشتیبان‌گیری، تکثیر داده‌ها (replication)، و فرآیندهای بازیابی به همراه رویه‌هایی برای اطمینان از واکنش سریع و بازیابی فوری در هنگام وقوع یک حادثه باشد.

هنگامی که در دیتاسنتر Naver آتش‌سوزی رخ داد و سرویس‌های آن کاملا قطع شدند؛ به دلیل داشتن یک نسخه­ی پشتیبان خارج از سایت، سریعا و در کمتر از چند ساعت، همه‌چیز بازیابی شده و به مدار بازگشتند. برعکس، شرکت Kakao در زمان آتش­سوزی هیچ‌گونه طرحی برای بازیابی در بلایای طبیعی یا سایت پشتیبان نداشت و سرویس‌های آن برای چندین روز قطع شدند. هنگامی که مرکزداده­ی اصلی Kakao کاملا بازیابی و عملیاتی شد، سریعا در مدت زمانی کمتر از دو ماه، یک سایت پشتیبان به صورت افزونه‌ای از سایت اصلی ساخت تا از اختلالات مشابه، جلوگیری کند. کاکائو، در سال جاری بیش از ۳۰۰ میلیون دلار برای تکمیل مرکزداده­ی خود هزینه می‌کند و ساخت یک مرکزداده­ی دیگر برای سال ۲۰۲۴ را در دستور کار خود دارد.