В Україні представили велику мовну модель Lapa LLM. Що відомо

27 октября, 11:18, 2025

Основою моделі стала архітектура Gemma-3-12B.

В Україні презентували велику мовну модель Lapa LLM v0.1.2, яку адаптували для роботи з українською мовою. Над нею працювали науковці з Українського католицького університету, Київського політехнічного інституту, Львівської політехніки та Гірничо-металургійної академії у Кракові. Про це пише видання DOU.

Мета мовної моделі — зробити швидку, точну та повністю відкриту українську LLM, придатну для досліджень і комерційного використання. Її основою стала архітектура великої мовної моделі Google — Gemma-3-12B.

Модель названа на честь Валентина Лапи — співавтора методу групового урахування аргументів, який став одним із теоретичних фундаментів сучасного Deep Learning (один із методів машинного навчання, який допомагає вирішувати специфічні завдання з обробки великих обсягів даних).

За словами розробників, при створенні Lapa LLM було замінено 80 тисяч із 250 тисяч токенів, завдяки чому обробка україномовного тексту стала ефективнішою — тепер для тих самих завдань потрібно у півтора раза менше обчислень. В УКУ кажуть, що за швидкістю роботи з українською нова модель обходить оригінальну Gemma та більшість закритих моделей аналогічного класу.

У тестах на продуктивність Lapa LLM продемонструвала стабільну роботу з великими текстами, збереження контексту й точність при відповідях на запитання. Серед іншого модель показала послідовність у визначенні маніпулятивних наративів і упереджених формулювань.

За словами розробників, у деяких завданнях Lapa LLM вже наближається до MamayLM, яка на сьогодні вважається лідером серед українських мовних моделей. У версії 1.0 творці Lapa LLM планують перевершити її результати.

Наразі сама модель повністю відкрита для комерційного використання. Водночас її розробники анонсували вихідний код для тренування та 25 навчальних датасетів (наборів даних). Перші 5 датасетів та частину коду для тренування автори вже опублікували на сторінці проєкту. Решту обіцяють викласти протягом тижня з моменту релізу.

Творці моделі кажуть, що в процесі її навчання застосовували відкриті українські корпуси та дані, оцінені за параметрами читабельності, граматики й відсутності дезінформації. На фінальних етапах використовувались матеріали Бібліотеки Гарварду.

Lapa LLM можна використовувати зокрема для створення корпоративних асистентів і чатботів українською, машинного перекладу між українською та англійською та роботи з конфіденційними текстами без передавання їх на зовнішні сервери.

Далі науковці планують створити міркувальну (reasoning) версію моделі та розширити корпуси для аналізу зображень і програмування.

Нагадаємо, у квітні Міністерство цифрової трансформації повідомляло, що до кінця року в Україні створять велику мовну модель, яка стане основою для появи чатботів та ШІ-асистентів для держави й бізнесу, що покращить послуги для користувачів і підвищить ефективність організацій.

Фото: Techopedia

ГО «Детектор медіа» понад 20 років бореться за кращу українську журналістику. Ми стежимо за дотриманням стандартів у медіа. Захищаємо права аудиторії на якісну інформацію. І допомагаємо читачам відрізняти правду від брехні.
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.

Долучитись

Теги по теме

Украина

Источник материала

Детектор М

Поделиться сюжетом

Технологии

Наука Космос Гаджеты Игры Интернет Другие

40-граммовый дрон-охотник: ИИ научили сбивать комаров в полете — видео

Знай

19 часов назад

Исчезнувшее поселение оказалось центром затерянного королевства: исследование все раставило по местах

Фокус

10 июля 2026

Как фараон Рамсес II: археологи древним методом создали мумию современного человека

Фокус

14 июля 2026

Солнце станет красным гигантом и выжжет Землю: сколько времени осталось человечеству

TSN

17 июля 2026

Энтузиасты выпустили нативную версию Castlevania: Symphony of the Night для ПК

GameMag

1 час назад

Слух: Watch Dogs Legion и Ghost Recon Wildlands выйдут на PlayStation 5 и Xbox Series S|X с новым контентом

GameMag

2 часа назад

Топ-5 лучших смартфонов OnePlus: бюджетные и флагманские модели на любой вкус

Фокус

15 июля 2026

Объявлены сроки проведения открытого тестирования Call of Duty: Modern Warfare 4

GameMag

2 часа назад

GamesVoice открыла сбор средств на русскую озвучку Assassin's Creed Black Flag Resynced для ПК — требуется 1,47 миллиона рублей

GameMag

2 часа назад