Meta оголосила збір аудіозаписів та транскрипцій з малопоширених мов для покращення навчання ШІ
Компанія Meta в партнерстві з ЮНЕСКО запускає програму зі збору аудіозаписів та їхніх транскрипцій різними мовами для навчання моделей, які у підсумку будуть загальнодоступними. Про це повідомило TechCrunch.
У межах програми Meta шукає партнерів, які можуть надати понад 10 годин записів мови з транскрипціями, великі обсяги письмових текстів (понад 200 речень) та набори перекладених речень різними мовами, особливо рідкісними.
Партнери працюватимуть із командами компанії, щоб інтегрувати ці мови в моделі розпізнавання мовлення та перекладу штучного інтелекту. У підсумку, ШІ-моделі будуть відкритими для всіх.
Серед партнерів наразі уряд Нунавуту, малонаселеної території півночі Канади. Деякі жителі Нунавута розмовляють інтуїтними мовами, відомими під загальною назвою інуктут.
Щоб приєднатися до проєкту, потрібно заповнити форму за посиланням.
Також Meta випустила еталонний тест для перевірки якості машинного перекладу. Тест, викладений на платформі з роброки ШІ Hugging Face, підтримує сім мов.
Meta позиціонує обидві ініціативи як благодійні, але вона отримає вигоду від вдосконалення моделей розпізнавання мовлення та перекладу, зазначило медіа.
Фото: howtogeek.com
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.
![loader](/files/images/preloader.gif)
![loader](/files/images/preloader.gif)