ИИ научился различать изображения

Американский разработчик технологий машинного обучения OpenAI представил новую версию языковой модели с искусственным интеллектом (ИИ) GPT-4. Она способна распознавать не только текст, но и визуальную информацию, рассказали в компании.

GPT-4 продемонстрировала успехи в ходе сдачи профессиональных и академических тестов, созданных для людей. Так, ИИ прошел экзамен на адвоката с оценкой, сравнимой с результатами 10% лучших участников. Предыдущая версия модели — GPT-3.5 — справлялась существенно хуже: как 10% участников, получивших самую низшую оценку.

По сравнению с GPT-3.5 новая модель «надежнее, креативнее и способна обрабатывать более сложные запросы». Производительность GPT-4 оценивали с помощью академических и машинных тестов, однако, это не в полной мере отражает ее возможности. OpenAI планирует в ближайшее время опубликовать еще ряд аналитических данных по этому поводу.

GPT-4 способна искать и обрабатывать документы, создавать контент. В отличие от прошлой, эта модель может принимать в качестве входных данных изображения, анализируя и классифицируя их.

Тренировочный запуск GPT-4 прошел стабильно. Модель встроили в популярный чат-бот ChatGPT. Пока ее могут использовать платные подписчики и тестировщики.

OpenAI — американский производитель технологий на основе машинного обучения. Одним из основателей является предприниматель Илон Маск.

Среди разработок OpenAI: чат-бот с ИИ, поддерживающий запросы на естественных языках, ChatGPT; нейронная сеть DALL-E, способная создавать высококачественные изображения из текстовых описаний на английском языке; модель ИИ Codex, которая анализирует естественный язык и генерирует код в ответ.

Ранее «Курсив» писал, что Маск видит опасность в неконтролируемом развитии ИИ.