Беларусь + FemTech = ❤️? Stork целится в миллион установок
Support us

«Крёстная мать ИИ»: настоящий прорыв начнётся, когда ИИ научится понимать пространство

Создательница ImageNet и основательница стартапа World Labs Фэй-Фэй Ли считает, что следующий прорыв в развитии искусственного интеллекта произойдет не в языке, а в пространстве.

1 комментарий
«Крёстная мать ИИ»: настоящий прорыв начнётся, когда ИИ научится понимать пространство

Создательница ImageNet и основательница стартапа World Labs Фэй-Фэй Ли считает, что следующий прорыв в развитии искусственного интеллекта произойдет не в языке, а в пространстве.

Знаменитая исследовательница и «крестная мать» ИИ считает, что только научившись понимать движение, расстояние и физические взаимосвязи, машины смогут стать по-настоящему творческими партнерами человека.

В своей новой работе Ли пишет, что современные языковые модели, даже мультимодальные, остаются «слепыми» к физике мира. Они умеют анализировать тексты и изображения, но не способны определить, насколько далеко находится объект, как он ориентирован или что произойдет, если его повернуть. «Современные модели блистательно работают с информацией, но не умеют взаимодействовать с реальностью», — отмечает она.

По мнению Ли, интеллект человека возник из способности ощущать и двигаться: задолго до речи или мышления живые организмы выстраивали связь между восприятием и действием. Именно это — «перцептивно-моторное» кольцо — стало основой эволюции разума. Поэтому настоящему ИИ нужно не просто понимать слова, а строить внутренние модели мира, в которых работают законы физики.

Ли приводит исторические примеры того, как пространственное мышление определяло научные прорывы: Эратосфен измерил окружность Земли по тени, Джеймс Харгривз изобрел прялку «Дженни», увидев, что можно располагать шпиндели параллельно, а Уотсон и Крик поняли структуру ДНК только после того, как поиграли с трехмерными моделями.

Для следующего этапа эволюции ИИ, пишет Ли, нужны не языковые, а мировые модели — системы, которые не просто описывают, а создают и изменяют трехмерные сцены, соблюдая причинно-физическую логику. Такие модели должны быть генеративными (способными создавать целостные миры), мультимодальными (понимать текст, изображение, видео и жесты) и интерактивными (предсказывать последствия действий).

Ее команда в World Labs уже работает над этим направлением. Цель — создать алгоритмы, которые смогут обучаться так же просто, как языковые модели обучаются предсказанию следующего слова, но в пространственном измерении. Прототип системы Marble способен по мультимодальному запросу создавать устойчивые трехмерные сцены. Пока проект далек от совершенства, но Ли видит в нем шаг к «пространственно осознанному ИИ».

Первые приложения Marble связаны с дизайном и цифровым искусством, однако в будущем Ли видит потенциал в робототехнике и науке: машины, понимающие пространство, смогут планировать действия, проводить эксперименты и исследовать мир — от морских глубин до лунных кратеров. Как когда-то зрение стало эволюционным прорывом для живых существ, так и способность ИИ понимать пространство, по словам Ли, может стать ключом к новой стадии развития машинного разума.

Новый ИИ решает стоит ли вас нанимать по фото в LinkedIn
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn
По теме
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn
Google придумала как решить одну из главных проблем ИИ
Google придумала, как решить одну из главных проблем ИИ 
По теме
Google придумала, как решить одну из главных проблем ИИ
Чем умнее становится ИИ тем эгоистичнее он себя ведёт
Чем умнее становится ИИ, тем эгоистичнее он себя ведёт
По теме
Чем умнее становится ИИ, тем эгоистичнее он себя ведёт
Читайте также
Чат-боты делают обучение поверхностным и снижают мотивацию
Чат-боты делают обучение поверхностным и снижают мотивацию
Чат-боты делают обучение поверхностным и снижают мотивацию
ИИ лишит работы до 40 млн человек только в США, но выход есть — мнение эксперта
ИИ лишит работы до 40 млн человек только в США, но выход есть — мнение эксперта
ИИ лишит работы до 40 млн человек только в США, но выход есть — мнение эксперта
1 комментарий
CEO Microsoft назвал ключевой навык работников в эпоху ИИ
CEO Microsoft назвал ключевой навык работников в эпоху ИИ
CEO Microsoft назвал ключевой навык работников в эпоху ИИ
DeepSeek выпустила две новые модели, которые обгоняют GPT-5 и Gemini 3.0 Pro
DeepSeek выпустила две новые модели, которые обгоняют GPT-5 и Gemini 3.0 Pro
DeepSeek выпустила две новые модели, которые обгоняют GPT-5 и Gemini 3.0 Pro

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

0

https://habr.com/ru/articles/965484/ схлопывается и не окупается "Почему мы теряем триллионы на ИИ и как это исправить"
символьный ии другое совсем

https://www.ixbt.com/news/2025/11/10/microsoft-meta-nvidia-1.html