Причиной неполадок в работе облачной системы хранения данных Amazon Web Services (AWS) S3, которые произошли в ночь на 1 марта по московскому времени и привели к перебоям в работе сотен веб-сайтов и сервисов, стала ошибка одного из инженеров AWS. Об этого говорится в сообщении, опубликованном на сайте облачного сервиса.
В релизе говорится, что во время устранения проблем в работе биллинговой системы S3 один из специалистов допустил опечатку при вводе команды и удалил больше серверов, чем требовалось. Выведенные из работы по ошибке серверы поддерживали работу двух подсистем S3: подсистему управления метаданными и информацией о местоположении и подсистему администрирования хранилищ.
В компании принесли извинения за инцидент и сообщили, что внесли ряд изменений в систему управления, чтобы подобная ошибка не повторилась в будущем.
Напомним, возникшая проблема отразилась на работе сервисов компаний Apple и Adobe, сервиса поиска жилья Airbnb, краудфандинговой платформы Kickstarter, портала онлайн-образования Coursera, платформы для программистов GitHub, почтового сервиса Mailchimp блог-платформы Medium и сайта Комиссии по ценным бумагам и биржам США.
Сбой произошел в дата-центре Amazon в штате Вирджиния, а устранить проблему удалось примерно через четыре часа, однако работа некоторых из затронутых сервисов была восстановлена только спустя еще несколько часов.