Аварии ЦОД: новости из США, Великобритании, Австралии, Ливана, Франции и Шпицбергена

Основная функция типичного дата-центра – обеспечение безотказной работы критически важных приложений, которые обслуживаются размещенными внутри ЦОД серверами и системами хранения данных. Однако возможны незапланированные отключения. Да, операторы центров обработки данных активно ищут способы предотвращения даунтаймов и внедряют передовой опыт / все более надежное оборудование. Но частота аварий все еще достаточно велика, что подтверждает свежий дайджест портала TelecomBloger, охватывающий новости из разных уголков планеты.

Сбой в системе электроснабжения дата-центра в Мичигане (США) привел к частичному прекращению работы местной больницы

12 января 2022 года посетители больницы Мичиганского университета (США) лишились доступа к онлайн-порталу, телефонной службе поддержке и сервису организации виртуальных посещений врачей. Причиной стали технические проблемы в местном ЦОД.

По словам представителей университета, сбой произошел из-за отключения электроэнергии в центре обработки данных северного кампуса. Техническим специалистам удалось восстановить работоспособность систем во второй половине того же дня. Представители организации принесли пациентам извинения за доставленные неудобства.

Авария в лондонском ЦОД Interxion привела к остановке товарной биржи

Авария в коммерческом дата-центре колокейшн-провайдера Interxion, расположенном в столице Великобритании, привела к остановке Лондонской биржи металлов (LME), являющейся ведущей мировой товарной биржей и специализирующаяся на торговле цветными металлами.

Причиной четырехчасового инцидента в дата-центре LON1 на Брик-лейн в восточной части Лондона, случившегося вечером 10 января 2022 года, стало отключение электроэнергии. Клиенты Interxion были возмущены отсутствием обратной связи со стороны компании во время инцидента.

По неподтвержденным данным, отключение затронуло весь первый этаж дата-центра. В ЦОД предусмотрены резервные каналы подачи электроэнергии. Но электрораспределительное устройство, предназначенное для переключения электропитания на местный генератор, по-видимому, отказало, что не позволило компании переключаться между электропитанием от центральной сети и ДГУ.

Пострадали несколько клиентов Interxion, но наиболее резонансным стало отключение электронных торгов на бирже LME. Биржа была недоступна около пяти часов (электронные торги прекратились примерно в 01:00 по местному времени и возобновились только в 6:15 утра следующего дня). Благо, многие трейдеры продолжили работать, используя телефоны.

Несколько клиентов Interxion пожаловались через социальные сети на то, что представители компании были недоступны во время инцидента. В последующем представители Interxion отметили, что системы поддержки клиентов компании были отключены из-за сбоя в ЦОД. Компания принесла извинения всем затронутым клиентам и партнерам, обязавшись провести комплексное расследование, чтобы определить основную причину сбоя, результаты которого будут использованы для повышения надежности и отказоустойчивости инфраструктуры в будущем.

В распоряжении Interxion имеется 15 лондонских дата-центров и три кампуса ЦОД в британской столице. В число последних входит кампус в восточной части Лондона, состоящий из серверных ферм LON1, LON2, LON3, общей площадью 9 400 кв. м (101 000 кв. футов). Дата-центр LON1, где случилась авария, обеспечивает арендаторам доступ в машзалы площадью 5 400 кв. м (58 100 кв. футов), рассредоточенные по пяти этажам. На объекте имеется 14 резервных дизель-генераторов.

Австралийский интернет-провайдер iiNet объяснил аварию ЦОД аномальной жарой в Перте

Австралийский интернет-провайдер iiNet заявил, что недавнее масштабное отключение, произошедшее в католическое Рождество, было вызвано неисправностью системы охлаждения в серверной ферме. В период рождественских праздников в центре обработки данных компании в Перте произошел сбой, в результате которого пользователи лишились доступа к веб-сайту iiNet и ряду сервисов компании. На полное устранение последствий аварии ушло около недели.

Первоначально представители компании заявила, что отключение было вызвано экстремальной погодой в западной Австралии, когда температура несколько дней подряд превышала 40 ° C (104 ° F). Из-за сильной жары в регионе отключили электричество. Впоследствии представители iiNet сообщили, что причиной инцидента стал отказ системы охлаждения дата-центра. Авария произошла днем 25 декабря. Обслуживание клиентов было частично восстановлено рано утром 27 декабря.

Интересно, что подобные аварии в данной серверной ферме случались и ранее. Так, в 2015 году на объекте iiNet в Перте произошел сбой из-за сильной жары, а в 2018 году — из-за отключения электроэнергии. «Мышиная чума» в Австралии также вызвала многочисленные отключения на объектах местных телекоммуникационных компаний в прошлом году.

Перебои в работе ливанской интернет-инфраструктуры из-за нехватки топлива

Обеспечение работоспособности интернет-инфраструктуры Ливана в последние месяцы осложняется постоянной нехваткой средств и топлива, что оборачивается длительными перебоями. Как отметили представители Министерства телекоммуникаций ближневосточной страны, провайдеры не могут обеспечить электропитание критически важной инфраструктуры, что приводит к массовым отключениям.

С июня ливанская государственная телекоммуникационная компания Ogero периодически сталкивается с перебоями в работе инфраструктуры, охватывающими десятки городов, из-за кризиса с дефицитом дизельного топлива, распространившегося на всю страну.

Гиперинфляция, наблюдающаяся в государстве течение последнего года, привела к резкому росту стоимости товаров и услуг, в то время как нехватка долларов США затруднила получение доступа к топливу. За последние два года ливанская валюта потеряла более 93 процентов своей стоимости по отношению к доллару. Covid-19, политический кризис и взрыв в порту Бейрута в 2020 году также способствовали быстрому экономическому коллапсу в Ливане. Отсутствие связи через интернет с родственниками, многие из которых бежали из страны в поисках лучшей жизни, ложится дополнительным бременем на тех, кто предпочел остаться.

51 организация присоединяется к групповому иску против OVHcloud из-за потери данных при пожаре в ЦОД

51 международная компания, столкнувшаяся с потерей ценных данных в марте 2021 года при пожаре в центре обработки данных французского поставщика облачных услуг OVHcloud в Страсбурге (от огня тогда пострадала серверная ферма с буквенно-цифровым обозначением SBG2), присоединилась к коллективному иску, требуя возмещения ущерба в размере до 1,9 миллиона евро.

Судебное разбирательство по вопросу компенсации планирует инициировать парижская юридическая фирма Ziegler Associates. Коллективный иск все еще открыт для присоединения новых пострадавших. Компания OVHcloud получит официальное письмо в следующем марте.

Пожар, случившийся 10 марта 2021 года, уничтожил центр обработки данных SBG2 и временно вывел из строя объект SBG1, располагающийся поблизости. Многие международные компании пострадали от простоев и потеряли ценные данные.

Компания OVHcloud до сих пор не предоставила никакой официальной информации о причине пожара, утверждая, что временно не может сделать это по юридическим причинам. В первоначальных сообщениях компании предполагалось, что возгорание началось в системах ИБП. Эксперты также ссылались на недостаточную эффективность противопожарных систем.

В OVHcloud отказались комментировать групповой иск Ziegler Associates до тех пор, пока не будет получено официальное письмо: «Мы не можем предоставлять дополнительные комментарии, поскольку дело до сих пор не передано ни в правоохранительные органы, ни нашим юристам».

Поставщик услуг веб-хостинга eNom столкнулся со сбоем в работе DNS после миграции ЦОД

Компания eNom, занимающаяся регистрацией доменных имен и веб-хостингом, 15 января 2022 года столкнулась со сбоями в работе системы доменных имен (DNS) в связи с перемещением оборудования в новый центр обработки данных.

Компания, основанная в 1997 году в Вашингтоне (США) и проданная в 2017 году компанией Rightside Group канадскому продавцу доменов Tucows за 83,5 миллиона долларов, по сообщениям, обслуживает около 15 миллионов доменных имен. Представители eNom сообщили, что текущие проблемы затронули несколько сотен доменов.

На Шпицбергене произошел сбой в электроснабжении подводного оптоволоконного кабеля

Один из двух волоконно-оптических кабелей, соединяющих остров Шпицберген с материковой Норвегией, вышел из строя в 4 утра (по местному времени) пятницы 7 января 2022 года, о чем сообщила телекоммуникационная компания Space Norway. В компании заявили об отсутствии информации касательно обстоятельств повреждения. В настоящее время проводится дальнейшее расследование. Для устранения повреждения необходимо мобилизовать кабелеукладочное судно.

Кабельная система протяженностью почти 1400 км (~ 840 миль), соединяющая с глобальной сетью самое северное поселение в мире с постоянным гражданским населением, состоит из двух линий.
Другая оптоволоконная линия работает, но в настоящее время нет резервирования на случай возникновения каких-либо проблем.

Представители норвежского Министерства юстиции и готовности к чрезвычайным ситуациям заявили, что ведомство следит за ситуацией и работает с Министерством торговли и промышленности, которому принадлежит Space Norway. Ведомство также поддерживает регулярные контакты с губернатором Шпицбергена.

На острове находится несколько наземных спутниковых станций, а также центры обработки данных. В частности, компании Piql и SNSK создали там дата-центр The Arctic World Archive , расположившийся в шахте в Лонгйире рядом со Всемирным семенохранилищем. Данные в ЦОД разместили многочисленные правительства, музеи и платформа GitHub.

Ожидается, что ремонт поврежденного кабеля начнется не ранее февраля 2022 года. Конкретные сроки проведения восстановительных работ будут указаны позже зависимости от погодных условий и доступности специализированных судов.

 
 

Источник