Навіщо Україні власна LLM-модель? Михайло Федоров про національну нейромережу та плани на AI-розвиток до 2030 року
Навіщо Україні власна LLM-модель? Михайло Федоров про національну нейромережу та плани на AI-розвиток до 2030 року

Навіщо Україні власна LLM-модель? Михайло Федоров про національну нейромережу та плани на AI-розвиток до 2030 року

В авторській колонці для AIN міністр цифрової трансформації Михайло Федоров ділиться планами на розвиток штучного інтелекту та що вже зроблено для запуску національної LLM-моделі.

Пів року тому ми затвердили Стратегію розвитку інновацій WINWIN до 2030 року.

Цей документ відповідає на запитання: куди ми рухаємося у сферах технологій та інновацій, де ми бачимо своє місце в цілому світі.

Адже, попри повномасштабну війну, весь світ не чекає нас і продовжує розвиватися — інвестує в технології, інновації, людський капітал.

Нам потрібно залишатися в цих перегонах, розвивати економіку, власну зброю, освіту, боротися з ворогом тощо.

Стратегія розвитку інновації WINWIN до 2030 року об’єднує такі важливі напрями, як Gov.

Tech, Defense.

Tech, Green.

Tech, Med.

Tech, і якраз відображає роль нашої держави, де ми можемо знайти своє місце, чим можемо займатися.

Звичайно, жодної стратегії не може бути без штучного інтелекту.

АІ зробив революцію та змінив наш світ так, як колись це зробив інтернет.

Кожна компанія має стати АІ-компанією, а кожен уряд — АІ-урядом.

І в цих змаганнях нам також потрібно мати своє місце у світі.

У напрямі АІ ми поставили амбітну ціль — до 2030 року потрапити в топ-3 країни світу за розробкою й інтеграцією штучного інтелекту в публічний сектор.

Це державне управління, оборона тощо.

І вже зараз ми закладаємо фундамент, який дасть нам змогу створювати інноваційні продукти на кшталт тих, які розробляє Mistral AI або OpenAI.

Можу сказати, що Україна вже має конкретні переваги, які ми можемо використовувати.

Перше — це дані, які зараз акумулюються в країні, і вони є унікальними, якщо ми говоримо про Defense Tech або Gov.

Друге — наша гнучкість, швидкість, жага конкуренції, свободи та швидке впровадження рішень.

Уже зараз ми розуміємо, як досягти цієї нашої цілі та увійти в топ-3.

Що ми вже зробили для цього Запустили WINWIN AI Center of Excellence.

Ми зібрали людей із ринку, які впроваджували штучний інтелект у компаніях і почали акумулювати експертизу, щоб працювати на державному рівні.

Тобто допомагати державним органам, і насамперед собі, запускати різні продукти та накопичувати експертизу.

WINWIN AI Center of Excellence — центр для розробки та інтеграції ШІ-рішень у державний сектор, оборону, медицину, освіту та бізнес.

Ми почали формувати національну AI-стратегію, яку розробимо до кінця цього року.

Вона буде мегаамбітною та показуватиме, куди ми рухаємося, які проблеми будемо розв’язувати.

Ще один важливий крок — розгортання власної, суверенної LLM-моделі, яка дасть змогу вирішувати безліч питань.

Це нейромережа, що працює за принципом людського мозку.

Вона здатна розуміти, аналізувати, генерувати тексти, перекладати чи навіть писати код.

Тобто це не умовний ChatGPT, а технологія, на якій побудовані такі сервіси, як ChatGPT, AI-асистенти, чатботи, голосові помічники.

Що дасть створення національної LLM-моделі По-перше, ми зможемо запускати сервіси в державі, не зберігаючи даних за кордоном або в інших місцях, які є сумнівними або можуть бути враженими.

Натомість будемо зберігати їх на власній інфраструктурі, використовуючи власну LLM-модель.

По-друге, зможемо працювати із сектором Defense Tech.

Сьогодні ми збираємо унікальну кількість даних з поля бою, яких немає у світі.

І зможемо цю інформацію обробляти та генерувати певні рішення завдяки LLM-моделі.

З погляду безпеки, це дуже важливо.

Національна LLM-модель буде навчена на українських даних, на нашій реальній історії та українських джерелах.

Вона передбачатиме наукові роботи, дані з бібліотек та іншу інформацію, яку використовуватимемо для навчання цієї моделі.

Також дані з державного сектору, але які не міститимуть сенситивної інформації.

Що важливо: розробка LLM відбуватиметься з дотриманням вимог законодавства, зокрема права інтелектуальної власності.

Водночас автори матимуть можливість «задонейтити» свої тексти для тренування моделі, щоб наповнити LLM унікальним українським контекстом.

По-третє, LLM-модель зможе використовувати різні організації, бізнеси для своїх цілей — створення продуктів і сервісів.

Як відбуватиметься робота над LLM-моделлю Це досить складний технологічний процес, який передбачає обробку великої кількості даних, навчання моделі, використання суперкомп’ютерів тощо.

Тобто це процес, який потребує й інвестицій, і часу, і експертизи.

Тому нам, як державі, потрібен партнер у цьому процесі, адже ми розуміємо свої сильні й слабкі сторони.

І нашим технічним і фінансовим партнером у цьому проєкті буде «Київстар», який допоможе побудувати й навчити цю модель.

Підписання Меморандуму Міністерства цифроої трансформації та «Київстар» Для роботи над LLM-моделлю ми створимо: координаційний комітет, який відповідатиме за візію та стратегію розробки моделі; технічний борд, який буде відповідати за архітектуру, тренування моделі на даних тощо; етичний борд, який відстежуватиме, на яких даних навчається модель, які є загрози й інші етичні питання, що вкрай важливо в інформаційну епоху.

У цьому процесі «Київстар» — операційний виконавець.

Компанія формуватиме проєктний офіс для розробки моделі: добиратиме команду, забезпечить обчислювальні потужності для попереднього тренування української моделі тощо.

«Київстар» також повністю покриває фінансову частину розробки LLM, до того ж кошти з державного бюджету не використовуються.

Наше спільне завдання — побудувати якісний продукт, який можна буде масштабувати й використовувати.

Загалом проєкт розрахований приблизно на дев’ять місяців.

Після офіційного запуску модель буде доступна державним установам, науковим та освітнім інституціям, громадським організаціям тощо.

Після тестувального періоду модель стане open source, щоб бізнеси могли його використовувати, і він буде відкритий і доступний.

Тож точно можу сказати, що створення власної LLM-моделі — це стратегічне рішення для нашої країни, яке допоможе нам увійти в топ-3 країни світу за розвитку штучного інтелекту.

City» — 3 роки.

Михайло Федоров про головні результати і плани простору.

Джерело матеріала
loader
loader