-6.4 C
Lviv
Четвер, 8 Січня, 2026

Українська LLM вийде в бета-тестування навесні 2026 року – Федоров

Эксклюзив

Українська національна велика мовна модель (LLM) вийде в бета-тестування навесні 2026 року. Розробку фінансує Київстар, а навчання моделі відбувається на сімействі моделей Gemma від Google.

Українська національна LLM (велика мовна модель) вийде в бета-тестування навесні 2026 року, повідомив у середу перший віцепрем'єр-міністр – міністр цифрової трансформації Михайло Федоров у Telegram, розповівши, на якому етапі розробка, пише УНН.

Національна LLM навесні вийде в бета-тестування. Місія України – увійти в топ-3 країни за розвитком штучного інтелекту у світі. Один з наймасштабніших кроків – запуск власної великої мовної моделі, яка навчена на унікальних українських даних

– написав Федоров.

Хто розробляє національну LLM

"Розробка LLM потребує ресурсів, а в часи війни всі кошти повинні бути спрямовані на оборону. Тому технічним партнером проєкту став Київстар. Компанія фінансує розробку національної великої мовної моделі, а потім передасть її державі", – вказав віцепрем'єр.

З його слів, українську LLM навчатимуть на сімействі моделей Gemma від Google – нашого стратегічного партнера. "Це передові технології, які ми адаптуємо під українську мову та контекст", – вказав він.

"А якість розробки національної LLM тестуватиме група незалежних експертів з різних галузей, яка перевірятиме модель на: технічну якість; етичність та безпечність для користувачів; знання української мови; розуміння національного контексту", – повідомив Федоров.

На якому етапі розробка зараз

"Нині триває найважливіша частина роботи – збір даних для навчання LLM. Для високої якості інформації з інтернету недостатньо, тому працюємо з державними органами, медіа, університетами та іншими інституціями – це терабайти унікальних даних", – розповів Федоров.

Паралельно, з його слів, створюється "юридичний фреймворк, щоб відповідально працювати з даними, які нам надають для тренування моделі".

Також, повідомив він, "група експертів уже працює над створенням бенчмарків – тестів для мовної моделі, які допоможуть оцінювати й покращувати її якість". Це, пояснив віцепрем'єр, "дасть змогу тримати у фокусі ефективність та безпеку мовної моделі".

Коли чекати на запуск української LLM

У січні 2026-го вже матимемо: першу базу текстів для тренування LLM; покращений токенізатор – інструмент, який розділяє слова на елементи, щоб LLM обробляла мову швидше а продуктивніше; власні бенчмарки для оцінки якості. Навесні 2026 року плануємо запустити бета-тестування. А назву для української LLM оберуть самі українці – у січні розпочнемо голосування в "Дії". Зробимо Україну AI-first державою

– підсумував Федоров.

Доповнення

Торік у березні при оголошенні про початок розробки Федоров заявляв, що запуск національної LLМ дасть старт масовому виробництву українських ШІ-інструментів. З його слів, тисячі ШІ-продуктів створені на базі LLM – віртуальні асистенти, як ChatGPT, генератори тексту, як Notion AI, інструменти для програмування, як GitHub Copilot.

Останні новини