/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2Fcb85c9770a5592777e904ad5b50148c0.jpg)
Масштабний збій кількох тисяч сервісів: Amazon пояснила причину
Цього тижня відключалися сайти, банківські сервіси й "розумні" пристрої по всьому світу.
Компанія Amazon Web Services (AWS) оприлюднила офіційне пояснення причин масштабного збою, який цього тижня призвів до тимчасового відключення тисяч сайтів, застосунків і хмарних сервісів у всьому світі. За даними компанії, проблема виникла через дефект у програмному забезпеченні для автоматизації системи доменних імен (Domain Name System, DNS), що спричинив каскадні відмови в роботі низки ключових інструментів AWS, передає The Guardian.
Як повідомила компанія у технічному звіті, збій почався з помилки в базі даних DynamoDB, де зберігаються DNS-записи клієнтів. Через “прихований дефект” система автоматизації створила порожній DNS-запис для регіону US-East-1 у Вірджинії, що унеможливило автоматичне виправлення збою. Для відновлення роботи сервісів знадобилося ручне втручання спеціалістів.
Після виявлення проблеми AWS тимчасово вимкнула автоматизовані процеси керування DNS для DynamoDB у всьому світі, щоб запобігти повторенню ситуації, і розпочала додавання нових механізмів безпеки та контролю. Представники компанії підкреслили, що планують переглянути внутрішні протоколи автоматизації, аби мінімізувати ризики подібних інцидентів у майбутньому.
Згідно з даними Downdetector, від збою постраждали близько двох тисяч компаній і сервісів, серед яких — Signal, Zoom, Canva, Snapchat, Roblox, Duolingo, а також низка банківських сайтів і платформа Ring doorbell. Усього користувачі по всьому світу надіслали понад 8,1 мільйона повідомлень про проблеми. Хоча більшість сервісів вдалося відновити протягом кількох годин, наслідки збою відчувалися протягом доби.
Збій зачепив і сферу інтернет-пристроїв. Користувачі компанії Eight Sleep, яка виробляє “розумні ліжка”, повідомили, що не могли керувати температурою чи положенням ліжка через мобільний застосунок. Генеральний директор компанії Маттео Франческотті публічно перепросив та повідомив про оновлення програмного забезпечення, яке дозволить у майбутньому керувати основними функціями ліжка через Bluetooth у разі відсутності підключення до мережі.
На думку фахівців, інцидент показав вразливість глобальної інфраструктури інтернету. Викладачка обчислювальної техніки Мельбурнського університету докторка Сьюлетт Дрейфус зазначила, що подібні події демонструють, наскільки світова цифрова економіка залежить від обмеженої кількості провайдерів хмарних рішень.
“Інтернет колись був створений як стійка децентралізована мережа. Але ми втратили частину цієї стійкості, покладаючись на кількох технологічних гігантів, які контролюють більшість обчислювальних і хмарних потужностей світу”, — наголосила Дрейфус.
За оцінками аналітиків, AWS нині займає близько 30% світового ринку хмарних послуг, що робить її критично важливим елементом цифрової інфраструктури. Останній збій став нагадуванням про те, наскільки навіть короткочасна відмова одного з таких вузлів може вплинути на глобальні технологічні та бізнес-процеси.
