Корейская компания LG выходит на рынок сервисов с искусственным интеллектом.
На мероприятии Computer Vision and Pattern Recognition 2023 представлен новый сервис Captioning AI на базе генеративного ИИ.
Если Midjourney и прочие известные ИИ генерируют изображение по описанию, то Captioning AI от LG создает описание по изображению.
Этот ИИ распознает элементы изображения и детально описывает их.
В теории это простая идея, но Captioning AI способен на глубокий анализ и выводы.
К примеру, ИИ способен точно описать положение человека на пейзаже.
ИИ основан на технологии Zero-shot Image Captioning от группы разработчиков LG AI Research.
При создании сервиса исследователи сотрудничали с платформой для хранения визуального контента Shutterstock.
ИИ может генерировать текстовые описания и ключевые слова для 10 000 изображений менее чем за два дня, что может повысить эффективность работы и производительность компаний, которые работают с большими объемами изображений.
The Korea Times.