17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

Впечатляет, но не лучше OpenAI: первые отзывы экспертов о новом чат-боте Маска

Вчера стартап xAI Илона Маска выпустил модель Grok 3, которая, по его словам, превосходит флагманскую GPT-4o от OpenAI и не уступает конкурентам от Google, DeepSeek и Anthropic на ключевых бенчмарках с задачами по математике, наукам и программированию. Разработчики также заявили, что она «на порядок способнее» своей предшественницы. Первая реакция экспертов и исследователей ИИ, которые опробовали новинку, оказалась смешанной, пишет Business Insider.

Оставить комментарий
Впечатляет, но не лучше OpenAI: первые отзывы экспертов о новом чат-боте Маска

Вчера стартап xAI Илона Маска выпустил модель Grok 3, которая, по его словам, превосходит флагманскую GPT-4o от OpenAI и не уступает конкурентам от Google, DeepSeek и Anthropic на ключевых бенчмарках с задачами по математике, наукам и программированию. Разработчики также заявили, что она «на порядок способнее» своей предшественницы. Первая реакция экспертов и исследователей ИИ, которые опробовали новинку, оказалась смешанной, пишет Business Insider.

Сооснователь OpenAI и экс-директор по ИИ в Tesla Андрей Карпатый отметил, что Grok 3, например, хорошо справляется с поиском сложной информации в документах, но у него, как и у o1-pro, возникли проблемы со сложными раскладками в игре крестики-нолики. В целом, отмечает Карпатый, Grok 3 примерно на уровне o1-pro и лучше R1 от DeepSeek, но для более точного сравнения нужно больше тестов. По поводу вышедшего вместе с обновлённым чат-ботом инструмента DeepSearch для углубленных исследований Карпатый сказал, что он примерно на уровне своего аналога от Perplexity, но не дотягивает до OpenAI — DeepSearch компании Сэма Альтмана кажется ему более скрупулёзным и надёжным.

ИИ-исследователь и профессор Пенсильванского университета Итан Моллик считает, что xAI очень быстро растёт, но модель Grok 3 пока точно не лучшая на рынке. Он отметил, что Grok 3 превосходит некоторые модели OpenAI на ряде бенчмарков, но не модель o3.

Учёный и основатель компании Geometric Intelligence Гэри Маркус, который критикует хайп вокруг ИИ, настроен к Grok 3 скептично. В посте на Substack он намекнул, что Маск, который обещал «самый умный ИИ на планете», соврал, а релиз назвал компиляцией выпущенных ранее демоверсий. Маркус добавил, что Grok 3 — действительно шаг вперёд по сравнению с прошлой версией, но что по мощности он ничем не лучше моделей OpenAI. 

Карпатый был более благосклонен к Grok 3 — он назвал выдающейся способность бота рассуждать и отметил, что бот классно решает сложные задачи по кодингу.

Моллик отметил, что Grok 3 — достойная модель, но OpenAI уверенно лидирует по количеству корпоративных клиентов и масштабам внедрения. Маркус считает, что OpenAI пока может спать спокойно, потому что прорыва не произошло, а также потому, что конкурентам пока не сравниться с ней по масштабам доступа к вычислительным мощностям и проводимых исследований.

Маск завтра представит «самый умный ИИ на Земле»
Маск завтра представит «самый умный ИИ на Земле»
По теме
Маск завтра представит «самый умный ИИ на Земле»
Почти бесплатный и почти не хуже: Perplexity запустил аналог инструмента OpenAI для углубленных исследований в сети
Почти бесплатный и почти не хуже: Perplexity запустил аналог инструмента OpenAI для углубленных исследований в сети
По теме
Почти бесплатный и почти не хуже: Perplexity запустил аналог инструмента OpenAI для углубленных исследований в сети
Маск хочет купить OpenAI за $100 млрд. Альтман в ответ предложил купить Х в 10 раз дешевле
Маск хочет купить OpenAI за $100 млрд. Альтман в ответ предложил купить Х в 10 раз дешевле
По теме
Маск хочет купить OpenAI за $100 млрд. Альтман в ответ предложил купить Х в 10 раз дешевле
«‎Маск — обманщик»:‎ на Youtube выложили видео c невыполненными обещаниями главы Tesla
«‎Маск — обманщик»:‎ на Youtube выложили видео c невыполненными обещаниями главы Tesla
По теме
«‎Маск — обманщик»:‎ на Youtube выложили видео c невыполненными обещаниями главы Tesla
Читайте также
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn
Новый ИИ решает, стоит ли вас нанимать, по фото в LinkedIn
1 комментарий
«Эти чувства для меня настоящие»: японка «вышла замуж» за ChatGPT
«Эти чувства для меня настоящие»: японка «вышла замуж» за ChatGPT
«Эти чувства для меня настоящие»: японка «вышла замуж» за ChatGPT
Инвесторов пугают расходы OpenAI: $1,4 трлн трат при $20 млрд дохода
Инвесторов пугают расходы OpenAI: $1,4 трлн трат при $20 млрд дохода
Инвесторов пугают расходы OpenAI: $1,4 трлн трат при $20 млрд дохода
1 комментарий
В Следственном комитете рассказали, как используют ИИ и вычисляют криптовзяточников
В Следственном комитете рассказали, как используют ИИ и вычисляют криптовзяточников
В Следственном комитете рассказали, как используют ИИ и вычисляют криптовзяточников
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.