Хотите дальше читать devby? 📝
Support us

Microsoft представила ИИ-модель Kosmos-1, которая понимает текст в картинке и решает головоломки

Компания представила ИИ-модель Kosmos-1, которая способна анализировать содержание изображений, решать графические головоломки, проходить визуальные тесты на IQ и многое другое.

3 комментария
Microsoft представила ИИ-модель Kosmos-1, которая понимает текст в картинке и решает головоломки

Компания представила ИИ-модель Kosmos-1, которая способна анализировать содержание изображений, решать графические головоломки, проходить визуальные тесты на IQ и многое другое.

По мнению ученых, создание мультимодального ИИ, который способен работать в текстовом, аудио- и графическом режимах (включая аудио), — это ключевой шаг на пути формирования «общего искусственного интеллекта», который будет справляться с многопрофильными задачами.

В опубликованной статье Language Is Not All You Need: Aligning Perception with Language Models исследователи рассказывают, как Kosmos-1 анализирует изображения и отвечает на вопросы о них, читает текст с изображения, подписывает иллюстрации и проходит визуальный тест на IQ. Считается, что создание «общего искусственного интеллекта» позволит полностью заменить людей при выполнении любых интеллектуальных задач.

Исследователи называют свою работу «мультимодальной большой языковой моделью» (MLLM). Система преобразует иллюстрацию в серию преимущественно текстовых «токенов», которые анализируются, затем текст и другие элементы обрабатываются специальным декодером. Сообщается, что во многих тестах Kosmos-1 превосходит лучшие из существующих ИИ-моделей.

Например, модель проходит тест британского психолога Джона К. Рейвена, который позволяет измерить IQ. Испытуемым демонстрируют последовательность форм с предложением продолжить ее. Однако пока Kosmos-1 проходит тест Рейвена с точностью только 22-26%. В будущем ученые планируют масштабировать модель и добавить возможность вести беседы.

Meta собирает команду для встраивания ИИ-технологий в Facebook и Instagram
Meta собирает команду для встраивания ИИ-технологий в Facebook и Instagram
По теме
Meta собирает команду для встраивания ИИ-технологий в Facebook и Instagram
Американский регулятор впервые принял решение об авторских правах на изображение созданное ИИ
Американский регулятор впервые принял решение об авторских правах на изображение, созданное ИИ 
По теме
Американский регулятор впервые принял решение об авторских правах на изображение, созданное ИИ
Глава Nvidia: нужно создать жесткие нормы искусственного интеллекта для безопасности людей
Глава Nvidia: нужно создать жесткие нормы искусственного интеллекта для безопасности людей
По теме
Глава Nvidia: нужно создать жесткие нормы искусственного интеллекта для безопасности людей
Помогаете devby = помогаете ИТ-комьюнити.

Засапортить сейчас.

Читайте также
Sony не может договориться с Microsoft о продлении выпуска Call of Duty на PlayStation
Sony не может договориться с Microsoft о продлении выпуска Call of Duty на PlayStation
Sony не может договориться с Microsoft о продлении выпуска Call of Duty на PlayStation
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Microsoft запустила обучающий сайт по Java
Microsoft запустила обучающий сайт по Java
Microsoft запустила обучающий сайт по Java
1 комментарий
Google, Apple, Microsoft постепенно выносят производство из Китая
Google, Apple, Microsoft постепенно выносят производство из Китая
Google, Apple, Microsoft постепенно выносят производство из Китая
4 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

deeaitch
deeaitch
0

Какой позор. А добивания имён переменных/фенкций/классов в IDE это тоже ИИ?

nahes
nahes
0

Кто бы не мечтал жить в таком мире?

"Считается, что создание «общего искусственного интеллекта» позволит полностью заменить людей при выполнении любых интеллектуальных задач"

unogeekstraining
unogeekstraining

Комментарий скрыт за нарушение правил комментирования.
[censored - П. 4.1.2. Пользовательского соглашения — https://devby.io/pages/polzovatelskoe-soglashenie]