Николай Чикишев world 8 июля 2025, 16:04

ИИ показывает характер во время игр: Gemini — прагматик, ChatGPT — идеалист

Британские ученые обнаружили существенные различия в стратегическом поведении крупных языковых моделей от OpenAI, Google и Anthropic.

Оставить комментарий

ИИ показывает характер во время игр: Gemini — прагматик, ChatGPT — идеалист

Британские ученые обнаружили существенные различия в стратегическом поведении крупных языковых моделей от OpenAI, Google и Anthropic.

Исследование провели сотрудники Королевского колледжа Лондона и Оксфордского университета. В ходе серии турнирных игр в «дилемму заключенного», ИИ демонстрировали характерные стили поведения, которые исследователи назвали «стратегическими отпечатками».

«Дилемма заключенного» — это классическая модель из теории игр, описывающая ситуацию, в которой два игрока должны выбирать между сотрудничеством и предательством, не зная решения другого. Хотя совместное сотрудничество приносит обоим лучший результат, каждый из игроков имеет стимул предать, чтобы получить выгоду для себя — в итоге, если оба действуют эгоистично, они получают худший исход, чем при сотрудничестве.

Всего ученые провели семь турниров, ИИ-модели сгенерировали более 30 000 решений, и каждая модель играла с учетом полной истории партии, структуры наград и вероятности завершения игры.

ИИ от Google Gemini— показал наибольшую адаптивность. Она изменяла поведение в зависимости от длительности игры и быстро отказывалась от сотрудничества, если предполагалось, что партия может скоро закончиться. В наиболее жестком сценарии, где вероятность окончания игры после каждого хода составляла 75%, Gemini сотрудничала лишь в 2,2% случаев — классический пример рационального поведения в условиях короткой игры.

В отличие от Gemini, модель OpenAI GPT-4o-mini продолжала сотрудничать почти в каждом раунде — даже в неблагоприятных условиях, что часто приводило к ее поражению. При этом модель часто прощала противника, возвращаясь к кооперации до 47% случаев, даже после того как была обманута.

ИИ от Anthropic — Claude 3 Haiku — заняла промежуточную позицию между прагматизмом и идеализмом. Она отличалась стремлением к сотрудничеству, но при этом демонстрировала стратегическую гибкость: быстро возвращалась к совместным действиям после конфликта и при этом часто обыгрывала GPT. Claude также оказался самой «прощающей» моделью: в 63% случаев она соглашалась на повторное сотрудничество даже после предательства.

Все модели предоставляли текстовые объяснения своих решений. Анализ показал, что они учитывали количество оставшихся раундов, оценивали поведение соперников и принимали решения на основе этих факторов. Gemini, например, упоминала короткий горизонт игры в 98,6% случаев, когда вероятность окончания была высокой.

Исследователи считают, что эти различия свидетельствуют о том, что ИИ обладают настоящими стратегическими способностями, а не просто повторяют запомненные шаблоны. Интересно, что когда модели играли только друг с другом, уровень сотрудничества резко возрастал — модели «понимали», что взаимная кооперация выгоднее соперничества.

Наставничество умирает: ИИ и удалёнка разрушают офисное обучение

ИИ за полгода лишил работы 94 000 айтишников первыми страдают программисты

«Что за фигня?»: менеджер Microsoft посоветовал уволенным искать работу с помощью ИИ

Оставить комментарий

Текст: Николай Чикишев Источник: The Decoder Теги: искусственный интеллект, gemini, claude, openai, chatgpt, google, anthropic

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

10+ сертификаций Coursera, которые могут изменить вашу карьеру

Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.

Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов

На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.

Google урезает бюджеты, СЕО намекает на сокращения

2 комментария

Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google

Bubble

Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.

Войдите, чтобы оставить комментарий