Масштабный сбой нескольких тысяч сервисов: Amazon объяснила причину
Масштабный сбой нескольких тысяч сервисов: Amazon объяснила причину

Масштабный сбой нескольких тысяч сервисов: Amazon объяснила причину

Масштабный сбой нескольких тысяч сервисов: Amazon объяснила причину

На этой неделе отключались сайты, банковские сервисы и "умные" устройства по всему миру.

Компания Amazon Web Services (AWS) обнародовала официальное объяснение причин масштабного сбоя, который на этой неделе привел к временному отключению тысяч сайтов, приложений и облачных сервисов во всем мире. По данным компании, проблема возникла из-за дефекта в программном обеспечении для автоматизации системы доменных имен (Domain Name System, DNS), повлекшего каскадные отказы в работе ряда ключевых инструментов AWS, передает The Guardian.

Как сообщила компания в техническом отчете, сбой начался с ошибки в базе данных DynamoDB, где хранятся DNS-записи клиентов. Из-за "скрытого дефекта" система автоматизации создала пустую DNS-запись для региона US-East-1 в Вирджинии, что сделало невозможным автоматическое исправление сбоя. Для восстановления работы сервисов понадобилось ручное вмешательство специалистов.

После обнаружения проблемы AWS временно отключила автоматизированные процессы управления DNS для DynamoDB во всем мире, чтобы предотвратить повторение ситуации, и начала добавление новых механизмов безопасности и контроля. Представители компании подчеркнули, что планируют пересмотреть внутренние протоколы автоматизации, чтобы минимизировать риски подобных инцидентов в будущем.

Согласно данным Downdetector, от сбоя пострадали около двух тысяч компаний и сервисов, среди которых — Signal, Zoom, Canva, Snapchat, Roblox, Duolingo, а также ряд банковских сайтов и платформа Ring doorbell. Всего пользователи по всему миру прислали более 8,1 миллиона сообщений о проблемах. Хотя большинство сервисов удалось восстановить в течение нескольких часов, последствия сбоя ощущались в течение суток.

Сбой затронул и сферу интернет-устройств. Пользователи компании Eight Sleep, которая производит "умные кровати", сообщили, что не могли управлять температурой или положением кровати через мобильное приложение. Генеральный директор компании Маттео Франческотти публично извинился и сообщил об обновлении программного обеспечения, которое позволит в будущем управлять основными функциями кровати через Bluetooth в случае отсутствия подключения к сети.

По мнению специалистов, инцидент показал уязвимость глобальной инфраструктуры интернета. Преподавательница вычислительной техники Мельбурнского университета доктор Сьюлетт Дрейфус отметила, что подобные события демонстрируют, насколько мировая цифровая экономика зависит от ограниченного количества провайдеров облачных решений.

"Интернет когда-то был создан как устойчивая децентрализованная сеть. Но мы потеряли часть этой устойчивости, полагаясь на нескольких технологических гигантов, которые контролируют большинство вычислительных и облачных мощностей мира", — подчеркнула Дрейфус.

По оценкам аналитиков, AWS сейчас занимает около 30% мирового рынка облачных услуг, что делает ее критически важным элементом цифровой инфраструктуры. Последний сбой стал напоминанием о том, насколько даже кратковременный отказ одного из таких узлов может повлиять на глобальные технологические и бизнес-процессы.

Ранее правозащитная организация Amnesty International опубликовала отчет, в котором призвала правительства решительно противодействовать влиянию и монополии технологических гигантов, таких как Google, Meta, Microsoft, Amazon и Apple, из-за рисков для прав человека. По мнению организации, концентрация их "власти" угрожает приватности пользователей и свободному доступу к информации.

Источник материала
loader