Дійсно несподівано. Нове дослідження показало, яку мову найкраще розуміє штучний інтелект
Дійсно несподівано. Нове дослідження показало, яку мову найкраще розуміє штучний інтелект

Дійсно несподівано. Нове дослідження показало, яку мову найкраще розуміє штучний інтелект

Нові результати дослідження Мерілендського університету та Microsoft показали несподіваний факт: польська мова виявилася найефективнішою для взаємодії зі штучним інтелектом, тоді як англійська, яку традиційно вважають мовою ІТ, посіла лише шосте місце.

Експеримент охопив 26 мов і перевіряв, як добре провідні мовні моделі — серед них ChatGPT, Google Gemini, Qwen, Llama і DeepSeek — розуміють та виконують однакові команди різними мовами. За середніми результатами польська мова показала точність 88%, випередивши французьку (87%), італійську (86%), іспанську (85%) та російську (84%). Англійська отримала 83,9%, а українська — 83,5%.

«Наш експеримент приніс кілька несподіваних результатів. Англійська, попри свій статус основної мови для навчання моделей, не стала лідером. Найкращі результати штучний інтелект показав саме з польською мовою, особливо під час роботи з довгими текстами», — йдеться у звіті дослідників.

Учасники дослідження визнали цей результат парадоксальним, адже польська мова традиційно вважається складною для вивчення людиною. Проте ШІ, схоже, без труднощів справляється з її граматикою та структурами. Польське патентне відомство прокоментувало відкриття словами: «З польською мовою виникають труднощі у людей, але не у штучного інтелекту».

Особливо цікаво, що польська посіла перше місце попри значно меншу кількість даних для навчання моделей порівняно з англійською чи китайською. Остання, до речі, опинилася майже внизу рейтингу — на 23-му місці з 26.

Дослідники припускають, що причиною такого успіху польської може бути її чітка граматична структура, а також висока морфологічна різноманітність, яка, навпаки, допомагає моделям краще розпізнавати контекст і зв’язки між словами.

У десятку найефективніших мов для ШІ увійшли: польська, французька, італійська, іспанська, російська, англійська, українська, португальська, німецька та нідерландська.

Источник материала
loader
loader