Україна починає розробку національної великої мовної моделі ШІ
Україна починає розробку національної великої мовної моделі ШІ

Україна починає розробку національної великої мовної моделі ШІ

WINWIN AI Center of Excellence при Мінцифрі та Київстар — оператор електронних комунікацій України — починають розробку національної великої мовної моделі (LLM).

Модель використовуватимуть у цифрових державних і бізнес-продуктах зі штучним інтелектом, щоб зробити сервіси зручнішими для людей та допомогти організаціям працювати ефективніше, повідомили у Міністерстві цифрової трансформації.

Велика мовна модель — це нейромережа, яка працює за принципом людського мозку й здатна аналізувати та генерувати тексти. Моделі використовують як базу для роботи чатботів, AI-асистентів тощо.

На основі мовної моделі держава створюватиме ШІ-продукти — для зручності громадян і покращення внутрішніх процесів. Так, Мінцифра планує запустити AI-асистента в Дії, інструменти для аналізу законодавства, а також сервіси в Мрії для формування індивідуальних освітніх траєкторій для школярів. Усього в роботі WINWIN AI Center of Excellence при Мінцифрі, який займається розробкою AI-рішень для міністерства, понад 10 продуктів.

Українська LLM даватиме точніші відповіді, ніж глобальні моделі, бо буде додатково натренована (pre-trained) на українських даних. Вона краще розумітиме мовні особливості — діалекти, терміни, контекст — і добре орієнтуватиметься в темах, пов’язаних з українською історією, культурою та суспільним досвідом. Так, модель відповідатиме правильно не лише мовно, а й за змістом.

Національна LLM дає змогу зберігати й обробляти дані всередині країни, що критично важливо для безпеки у сфері оборони, державних установ, медицини та фінансів. Модель забезпечить захист персональних даних і національної безпеки України при інтеграції AI в різні сектори.

"Створення української LLM — важливий крок до лідерства України у сфері ШІ. Ми як держава зможемо створювати зручні AI-сервіси для громадян та зробимо штучний інтелект помічником уряду. При цьому цей ШІ буде якісним та безпечним для громадян. Так, AI стане частиною оборони, освіти, науки та інших стратегічних сфер. З іншого боку, національна LLM дасть змогу бізнесу створювати інноваційні продукти — дешевші, безпечніші й адаптовані до українського контексту. Для реалізації цього амбітного проєкту ми об’єднуємо зусилля Мінцифри з Київстаром. Це приклад ефективного партнерства, коли провідний бізнес долучається до створення рішень національного масштабу", — зазначив Михайло Федоров, Віцепрем’єр-міністр з інновацій, розвитку освіти, науки та технологій — Міністр цифрової трансформації.

Мінцифра координуватиме процес розробки моделі та формуватиме технологічну й етичну візію створення LLM. Зокрема, створить усі ключові структури для якісної розробки моделі — координаційний комітет й етичний та технічний борди.

Координаційний комітет відповідатиме за візію і стратегію розробки. До нього увійдуть представники Мінцифри, WINWIN AI Center of Excellence, інших профільних державних інституцій, Київстару, технічного та етичного бордів. Етичний борд відстежуватиме відповідність законодавству та етичність моделі. Технічний борд відповідатиме за архітектуру, тренування моделі на даних тощо. Розробкою моделі займатиметься проєктний офіс, сформований компанією Київстар як операційним виконавцем розробки моделі.

Мінцифра забезпечуватиме збір даних для навчання моделі, для чого залучатиме державні та приватні інституції — університети, наукові структури, національні бібліотеки й інтелектуальні фонди. До навчання залучатимуть дані з відкритих джерел українською мовою, зібрані в датасетах. Персональні дані, дані з реєстрів та будь-яку іншу чутливу інформацію для pre-training не використовуватимуть.

Стратегічним партнером держави у створенні національної LLM став Київстар — національний оператор електронних комунікацій. Компанія активно інвестує в нові технології та цифрові сервіси, має глибоку експертизу у сфері ШІ та інтегрує AI-рішення в довгострокову стратегію технологічної трансформації. Київстар поєднує мовні моделі та сучасні RAG-системи (Retrieval Augmented Generation) з реальними бізнес-процесами, сервісною підтримкою та аналізом даних, дотримуючись високих стандартів безпеки й етики.

Київстар має прямий доступ до міжнародного досвіду через материнську компанію VEON, яка вже реалізувала успішні національні AI-проєкти. Так, Київстар стане надійним технологічним партнером на старті, допоможе забезпечити швидкий запуск і створити LLM, максимально адаптовану до мови й культури України.

Використання українськомовної моделі коштуватиме дешевше для українських користувачів порівняно з англомовними аналогами. Після розробки та тестового періоду модель стане власністю держави. З моменту готовності LLM держава одразу матиме до неї доступ для безоплатного використання.

Поява українськомовної LLM сприятиме появі нових AI-стартапів, залученню міжнародних інвестицій у країну та підвищуватиме ВВП завдяки розробці AI-рішень для різних секторів економіки.

Основа для національної моделі — одне з open-source рішень, без залучення державних коштів. Першу версію моделі планують запустити до грудня 2025 року.

Джерело матеріала
loader