Про це повідомляється на сайті компанії, передає Укрінформ.
Voice Engine використовує 15-секундний зразок звучання мови конкретної людини, щоб відтворити його під час озвучення тексту. Технологію розробляли з кінця 2022 року і спочатку для озвучення використовувались попередньо встановлені зразки голосів.
Наразі публічного доступу до Voice Engine немає, оскільки розробники побоюються недоброчесного його використання.
«Ми сподіваємося розпочати діалог про відповідальне застосування синтетичних голосів і про те, як суспільство може адаптуватися до цих нових можливостей. На основі цих обговорень і результатів тестів ми приймемо більш обґрунтоване рішення щодо того чи варто розгортати цю технологію у масштабі і в який спосіб це робити», – зауважили в OpenAI.
Зазначається, що Voice Engine лежить в основі функції «Читання вголос» чат-боту ChatGPT.
На думку розробників, цю технологію можна буде використовувати для допомоги тим, хто не вміє читати, а також дітям; для перекладу відео та подкастів; для допомоги відновлення голосу пацієнтам із раптовими або дегенеративними станами мовленнєвого апарату. Крім того, Voice Engine може дати змогу німим людям спілкуватися.
Приклади застосування Voice Engine у кожному із зазначених випадків наведені у блозі.
Як повідомлялося, компанія Meta тестує чат-бот та фоторедактор на основі штучного інтелекту в останніх бета-версіях месенджера WhatsApp.
Фото: Gabby Jones/Bloomberg