Дата-центр и все компьютеры крупного банка «легли» из-за четырёх обычных батареек
Читатель The Register, который работал в крупном британском банке, рассказал, как однажды там произошёл масштабный сбой: вышла из строя вся информационная система, включая дата-центр. Проблема была столь серьёзна, что никто из работников банка не мог выполнять свои обязанности.
О проблеме стало известно рано утром, а через несколько часов ожидался ежедневный резкий скачок операций, проходящих через банк. Это усложняло работу ИТ-службе банка, которая никак не могла найти корень зла.
Работники банка только мешали поиску, постоянно требуя «поднять» систему как можно скорее. Перезагрузка серверов и тщательная диагностика ничего не выявили.
Всему виной оказался человеческий фактор: сотрудники банка забыли поменять батарейки в двух стареньких, запылившихся радиочасах на подоконнике, которые играют важную роль в стабильном функционировании всей организации.
Оба устройства синхронизируются с радиосигналами, по которым получают информацию о точном времени. Одни часы затем передают её на серверы Novell, а вторые — на компьютеры банка под управлением Windows.
Работники техподдержки были обязаны хотя бы раз в год заменять батарейки типа АА в этих часах — по две на каждые. Батарейки разрядились, и дата на всех устройствах в банке, которые получали точное время от двух часов, автоматически сменилась на 1 января 1970 года. Ни один из серверов и ПК банка в тот период ещё не существовал, к тому же эта дата является для большинства современных операционных систем стартом отсчёта времени.
После замены батареек часы быстро поймали сигнал с точными временем и датой и раздали информацию всем устройствам в сети банка, а работа финансовой организации восстановилась. Почему настолько важные часы не были подключены к резервному источнику питания, неясно.
Сколько убытков банк понёс из-за разрядившихся батареек, неизвестно. Как и то, был ли кто-либо из службы поддержки уволен за халатность. Инженеры, посовещавшись, не стали никому признаваться, что на самом деле случилось, и списали всё на плохо закреплённый сетевой кабель.
Читать на dev.by