Cloudflare заманює веб-ботів у «лабіринт ШІ»
Cloudflare заманює веб-ботів у «лабіринт ШІ»

Cloudflare заманює веб-ботів у «лабіринт ШІ»

Cloudflare, одна з найбільших у світі компаній, що займаються мережевою інтернет-інфраструктурою, анонсувала AI Labyrinth, новий інструмент для боротьби з ботами, що сканують веб-сайти, які збирають із сайтів навчальні дані ШІ без дозволу. У дописі в блозі компанія зазначає , що коли вона виявляє «неналежну поведінку бота», безплатний інструмент за бажанням заманює сканерів на шлях посилань на створені штучним інтелектом сторінки-приманки, які «уповільнюють, заплутують і витрачають ресурси» тих, хто діє недобросовісно.

Веб-сайти вже давно використовують системний підхід robots.txt , текстовий файл, який дає або забороняє дозвіл скребкам, але компанії штучного інтелекту, навіть такі відомі, як Anthropic і Perplexity AI , звинувачують в ігноруванні. Cloudflare пише, що бачить понад 50 мільярдів запитів веб-сканера на день, і хоча у нього є інструменти для виявлення та блокування зловмисників, це часто спонукає зловмисників змінювати тактику в «нескінченній гонитві озброєнь».

Cloudflare каже, що замість того, щоб блокувати ботів, AI Labyrinth дає відповідь, змушуючи їх обробляти дані, які не мають нічого спільного з фактичними даними веб-сайту. Компанія каже, що вона також функціонує як «приманка наступного покоління», залучаючи сканери ШІ, які продовжують переходити за посиланнями на фейкові сторінки глибше, тоді як звичайна людина цього не робить. У ньому сказано, що це полегшує пошук відбитків пальців шкідливих ботів для списку зловмисників Cloudflare, а також ідентифікує «нові шаблони та підписи ботів», які інакше б вони не виявили. Згідно з дописом, ці посилання не повинні бути видимими для відвідувачів.

Ви можете прочитати більше про те, як AI Labyrinth працює в блозі Cloudflare, але ось трохи більше деталей з публікації:

Ми виявили, що спочатку створення різноманітного набору тем, а потім створення вмісту для кожної теми дало більш різноманітні та переконливі результати. Для нас важливо, щоб ми не створювали недостовірний вміст, який сприяє поширенню дезінформації в Інтернеті, тому контент, який ми створюємо, є справжнім і пов’язаним з науковими фактами, а не має відношення до веб-сайту, який сканується.

Адміністратори веб-сайтів можуть увімкнути використання AI Labyrinth, перейшовши до розділу «Керування роботами» налаштувань інформаційної панелі Cloudflare свого сайту та ввімкнувши його. Компанія каже, що це «лише перша ітерація використання генеративного штучного інтелекту для запобігання роботам». Він планує створити «цілі мережі пов’язаних URL-адрес», які роботам, які в кінцевому підсумку потраплять, буде важко вважати підробленими. Як зазначає Ars Technica , AI Labyrinth звучить схоже на Nepenthes, інструмент, який призначений для того, щоб сканери на «місяці» залишали в стороні пекло сміттєвих даних, створених штучним інтелектом.

Джерело матеріала
loader
loader