Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами! Это просто и ничего не стоит
Support us

Alibaba выпустила ИИ-модель, которая может управлять ПК и телефонами

Ещё один сюрприз для OpenAI подготовила Alibaba: китайский техногигант вчера выпустил новое семейство многофункциональных моделей Qwen2.5-VL. Ранее китайский стартап DeepSeek выпустил большую языковую модель, которая гораздо дешевле o1, и генератор картинок, который на некоторых бенчмарках показал себя лучше DALLE-3.

1 комментарий

Ещё один сюрприз для OpenAI подготовила Alibaba: китайский техногигант вчера выпустил новое семейство многофункциональных моделей Qwen2.5-VL. Ранее китайский стартап DeepSeek выпустил большую языковую модель, которая гораздо дешевле o1, и генератор картинок, который на некоторых бенчмарках показал себя лучше DALLE-3.

Модели Qwen2.5-VL умеют выполнять различные задачи с текстовыми документами и визуалом. Они могут, например, обрабатывать графики и извлекать данные из сканов инвойсов и бланков, считать предметы на картинках, понимать происходящее на видео длиной в несколько часов (в том числе опознавать объекты интеллектуальной собственности и разные продукты в фильмах и сериалах). Однако одна из наиболее выдающихся функций — способность взаимодействовать с софтом компьютеров и смартфонов и управлять гаджетами. Подобно инструменту Operator от OpenAI, модель Qwen2.5-VL может, напрмер, открыть приложение Booking и забронировать авиабилеты.

Разработчики заявляют, что лучшая из моделей Qwen2.5-VL превосходит GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic и Gemini 2.0 Flash от Google в ряде тестов на понимание видео, анализ документов, ответы на вопросы и по математике. Однако на бенчмарке OSWorld, который имитирует компьютерную среду, результаты Qwen2.5-VL не очень.

Qwen2.5-VL доступны в приложении Qwen Chat, скачать модели можно на платформе Hugging Face, техлид которой продемонстрировал новинку в деле. Но поскольку модели китайские, нужно быть готовым к цензуре: они не будут обсуждать запретные темы вроде автономии Тайваня или «ошибок Си» — по этому запросу, например, приложение само выдаёт ошибку.

Две младшие модели на 3 млрд и 7 млрд параметров доступны свободно. Флагманская на 72 млрд параметров распространяется по кастомной лицензии Alibaba, которая обязует компании и разработчиков с 100+ ежемесячных активных пользователей запрашивать разрешение на коммерческое развёртывание модели.

OpenAI запустила ИИ-агента который может купить продукты и забронировать билеты вместо пользователя
OpenAI запустила ИИ-агента, который может купить продукты и забронировать билеты вместо пользователя
По теме
OpenAI запустила ИИ-агента, который может купить продукты и забронировать билеты вместо пользователя
DeepSeek запустил ИИ-генератор изображений который превосходит OpenAI
DeepSeek запустил ИИ-генератор изображений, который превосходит OpenAI
По теме
DeepSeek запустил ИИ-генератор изображений, который превосходит OpenAI
Ещё больше цензуры: власти Китая теперь проверяют ИИ-модели на соответствие социалистическим ценностям
Ещё больше цензуры: власти Китая теперь проверяют ИИ-модели на соответствие социалистическим ценностям
По теме
Ещё больше цензуры: власти Китая теперь проверяют ИИ-модели на соответствие социалистическим ценностям
Среда разработки Replit уволила половину штата, а выручку нарастила в 5 раз
Среда разработки Replit уволила половину штата, а выручку нарастила в 5 раз
По теме
Среда разработки Replit уволила половину штата, а выручку нарастила в 5 раз
Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами!

Это просто и ничего не стоит

Читайте также
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
4 комментария
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

0

Китайский SkyNet все ближе...