Support us

ИИ показывает характер во время игр: Gemini — прагматик, ChatGPT — идеалист

Британские ученые обнаружили существенные различия в стратегическом поведении крупных языковых моделей от OpenAI, Google и Anthropic.

Оставить комментарий
ИИ показывает характер во время игр: Gemini — прагматик, ChatGPT — идеалист

Британские ученые обнаружили существенные различия в стратегическом поведении крупных языковых моделей от OpenAI, Google и Anthropic.

Исследование провели сотрудники Королевского колледжа Лондона и Оксфордского университета. В ходе серии турнирных игр в «дилемму заключенного», ИИ демонстрировали характерные стили поведения, которые исследователи назвали «стратегическими отпечатками».

«Дилемма заключенного» — это классическая модель из теории игр, описывающая ситуацию, в которой два игрока должны выбирать между сотрудничеством и предательством, не зная решения другого. Хотя совместное сотрудничество приносит обоим лучший результат, каждый из игроков имеет стимул предать, чтобы получить выгоду для себя — в итоге, если оба действуют эгоистично, они получают худший исход, чем при сотрудничестве.

Всего ученые провели семь турниров, ИИ-модели сгенерировали более 30 000 решений, и каждая модель играла с учетом полной истории партии, структуры наград и вероятности завершения игры.

ИИ от Google Gemini— показал наибольшую адаптивность. Она изменяла поведение в зависимости от длительности игры и быстро отказывалась от сотрудничества, если предполагалось, что партия может скоро закончиться. В наиболее жестком сценарии, где вероятность окончания игры после каждого хода составляла 75%, Gemini сотрудничала лишь в 2,2% случаев — классический пример рационального поведения в условиях короткой игры.

В отличие от Gemini, модель OpenAI GPT-4o-mini продолжала сотрудничать почти в каждом раунде — даже в неблагоприятных условиях, что часто приводило к ее поражению. При этом модель часто прощала противника, возвращаясь к кооперации до 47% случаев, даже после того как была обманута.

ИИ от Anthropic — Claude 3 Haiku — заняла промежуточную позицию между прагматизмом и идеализмом. Она отличалась стремлением к сотрудничеству, но при этом демонстрировала стратегическую гибкость: быстро возвращалась к совместным действиям после конфликта и при этом часто обыгрывала GPT. Claude также оказался самой «прощающей» моделью: в 63% случаев она соглашалась на повторное сотрудничество даже после предательства.

Все модели предоставляли текстовые объяснения своих решений. Анализ показал, что они учитывали количество оставшихся раундов, оценивали поведение соперников и принимали решения на основе этих факторов. Gemini, например, упоминала короткий горизонт игры в 98,6% случаев, когда вероятность окончания была высокой.

Исследователи считают, что эти различия свидетельствуют о том, что ИИ обладают настоящими стратегическими способностями, а не просто повторяют запомненные шаблоны. Интересно, что когда модели играли только друг с другом, уровень сотрудничества резко возрастал — модели «понимали», что взаимная кооперация выгоднее соперничества.

Наставничество умирает: ИИ и удалёнка разрушают офисное обучение
Наставничество умирает: ИИ и удалёнка разрушают офисное обучение
По теме
Наставничество умирает: ИИ и удалёнка разрушают офисное обучение
ИИ за полгода лишил работы 94 000 айтишников первыми страдают программисты
ИИ за полгода лишил работы 94 000 айтишников, первыми страдают программисты
По теме
ИИ за полгода лишил работы 94 000 айтишников, первыми страдают программисты
«Что за фигня?»: менеджер Microsoft посоветовал уволенным искать работу с помощью ИИ
«Что за фигня?»: менеджер Microsoft посоветовал уволенным искать работу с помощью ИИ 
По теме
«Что за фигня?»: менеджер Microsoft посоветовал уволенным искать работу с помощью ИИ
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
2 комментария
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google
Bubble
Производительность должна измеряться в IT не так, как у других. Наглядный кейс — Google

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.