ИИ не умеет зарабатывать: все топ-модели проиграли в ставках на спорт
Популярные модели искусственного интеллекта не смогли заработать на ставках на матчи Премьер-лиги и в большинстве случаев ушли в минус. Эксперимент показал, что даже передовые системы плохо справляются с долгосрочными прогнозами в сложных и непредсказуемых условиях реального мира.
Популярные модели искусственного интеллекта не смогли заработать на ставках на матчи Премьер-лиги и в большинстве случаев ушли в минус. Эксперимент показал, что даже передовые системы плохо справляются с долгосрочными прогнозами в сложных и непредсказуемых условиях реального мира.
Об этом сообщает Financial Times со ссылкой на исследование стартапа General Reasoning, в котором проверялась способность ИИ принимать решения в условиях длительной и изменяющейся среды.
В рамках эксперимента исследователи протестировали восемь передовых моделей, которым предоставили подробные исторические данные, статистику команд и результаты предыдущих игр. Задача заключалась в том, чтобы построить стратегии ставок с максимальной доходностью и управлением рисками.
После этого ИИ-агенты делали ставки на исход матчей и количество голов, адаптируясь к изменениям по ходу сезона, включая новые данные о командах и игроках. При этом модели не имели доступа к интернету и получали три попытки, чтобы выйти в плюс.
Все системы начинали с условного банка в £100 тысяч, однако ни одна из них не смогла показать устойчивую прибыль. Лучший результат продемонстрировала модель Claude Opus 4.6 от Anthropic со средним убытком около 11%, при этом в одной из попыток она почти вышла в ноль.
Модель Grok от xAI в одном случае полностью потеряла банк и не смогла завершить остальные попытки. Gemini от Google показала прибыль около 34% в одной симуляции, но в другой полностью обанкротилась. Ряд других моделей, включая Trinity, также потеряли весь капитал.
Авторы исследования отмечают, что все протестированные модели в итоге проиграли деньги и во многих случаях уступали человеку в принятии решений.
По словам генерального директора General Reasoning Росса Тейлора, вокруг автоматизации с помощью ИИ существует значительный ажиотаж, однако реальные измерения эффективности в долгосрочных и динамичных задачах практически отсутствуют. Он подчеркнул, что большинство бенчмарков оценивают системы в статичных условиях, которые плохо отражают сложность реального мира.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.