Дата-центр и все компьютеры крупного банка «легли» из-за четырёх обычных батареек

Читатель The Register, который работал в крупном британском банке, рассказал, как однажды там произошёл масштабный сбой: вышла из строя вся информационная система, включая дата-центр. Проблема была столь серьёзна, что никто из работников банка не мог выполнять свои обязанности.

1 комментарий

О проблеме стало известно рано утром, а через несколько часов ожидался ежедневный резкий скачок операций, проходящих через банк. Это усложняло работу ИТ-службе банка, которая никак не могла найти корень зла.

Работники банка только мешали поиску, постоянно требуя «поднять» систему как можно скорее. Перезагрузка серверов и тщательная диагностика ничего не выявили.

Всему виной оказался человеческий фактор: сотрудники банка забыли поменять батарейки в двух стареньких, запылившихся радиочасах на подоконнике, которые играют важную роль в стабильном функционировании всей организации.

Оба устройства синхронизируются с радиосигналами, по которым получают информацию о точном времени. Одни часы затем передают её на серверы Novell, а вторые — на компьютеры банка под управлением Windows.

Почти половина австралийцев внезапно осталась без телефона и интернета
По теме
Почти половина австралийцев внезапно осталась без телефона и интернета

Работники техподдержки были обязаны хотя бы раз в год заменять батарейки типа АА в этих часах — по две на каждые. Батарейки разрядились, и дата на всех устройствах в банке, которые получали точное время от двух часов, автоматически сменилась на 1 января 1970 года. Ни один из серверов и ПК банка в тот период ещё не существовал, к тому же эта дата является для большинства современных операционных систем стартом отсчёта времени. 

После замены батареек часы быстро поймали сигнал с точными временем и датой и раздали информацию всем устройствам в сети банка, а работа финансовой организации восстановилась. Почему настолько важные часы не были подключены к резервному источнику питания, неясно.

Сколько убытков банк понёс из-за разрядившихся батареек, неизвестно. Как и то, был ли кто-либо из службы поддержки уволен за халатность. Инженеры, посовещавшись, не стали никому признаваться, что на самом деле случилось, и списали всё на плохо закреплённый сетевой кабель.

Маск попросил сотрудников Twitter приостановить разработку новых функций из-за масштабного сбоя
По теме
Маск попросил сотрудников Twitter приостановить разработку новых функций из-за масштабного сбоя
Британский банк крупно оштрафовали за неудачный переход на новую ИТ-систему
По теме
Британский банк крупно оштрафовали за неудачный переход на новую ИТ-систему

Читать на dev.by