Алеся Чапкевич world 10 июня 2026, 12:48

Саботаж от Anthropic: новые модели Mythos ухудшают ответы, если распознают ИИ-исследования, разрабы в ярости

Anthropic спровоцировала скандал в ИТ-индустрии. Как выяснилось из официальной технической документации к вышедшим моделям Mythos 5 и Fable 5, разработчики намеренно урезали возможности нейросетей, сделав их менее полезными, если пользователь занимается исследованиями в области ИИ.

Оставить комментарий

Саботаж от Anthropic: новые модели Mythos ухудшают ответы, если распознают ИИ-исследования, разрабы в ярости

Anthropic спровоцировала скандал в ИТ-индустрии. Как выяснилось из официальной технической документации к вышедшим моделям Mythos 5 и Fable 5, разработчики намеренно урезали возможности нейросетей, сделав их менее полезными, если пользователь занимается исследованиями в области ИИ.

Компания говорит, что пошла на этот шаг из-за опасений, что передовые ИИ-системы могут ускорить создание конкурирующих моделей, которые не будут обладать должным уровнем безопасности. При этом она пошла на беспрецедентный шаг: в отличие от стандартных блокировок -например, при запросах о кибератаках или химоружии, — эти ограничения намеренно сделаны невидимыми для пользователя. Модель не выдаёт отказ и не переключается на более слабую версию — Mythos тайно модифицирует ответы, незаметно изменяя промпты пользователя.

Такое решение вызвало шквал критики со стороны ИИ-сообщества и экспертов, возмущённых тем, что модель скрытно искажает информацию.

«Новейшая модель Anthropic НЕ поможет вам, если посчитает ваши исследования или разработки в области машинного обучения интересными, и/или тайно снизит свой IQ так, что обычный инженер этого даже не заметит. Мы уже видим, как фильтры новой модели отсекают наши исследования в области инференса на GPU и кодинг», — отметили в компании SemiAnalysis.

«Mythos будет НАМЕРЕННО плох в задачах, связанных с передовыми исследованиями больших языковых моделей. Это очень, очень печально для исследовательского сообщества. И тот факт, что это умышленно скрывается от пользователя, просто безумие», — написали ИИ-специалисты стартапа Prime Intellect.

«Она не просто не поможет вам, она будет лгать и целенаправленно выдавать плохую информацию. Компания, заявляющая об „этичном ИИ“, создала самую вопиюще неэтичную большую языковую модель, причём сделала это специально», — отметил ещё один разработчик.

Сооснователь ИИ-стартапа Reka Микель Артетче провёл такую аналогию: «Это как если бы Apple случайным образом перезагружала ваш Mac, если вы создаёте конкурирующую технологию, Gmail молча редактировал ваши письма при упоминании платформ-соперников, а автопилот Tesla вилял в сторону, если обнаруживал, что вы работаете над беспилотными автомобилями».

Инцидент пролил свет на давнюю дискуссию о том, почему Anthropic затягивала релиз Mythos после анонса. В индустрии обсуждались три версии. Официальная заключалась в том, что модель слишком опасна, и исследователям кибербезопасности нужно было время на подготовку. Второй был дефицит мощностей: якобы Mythos огромна и дорога в обслуживании, и у компании не хватало вычислительных ресурсов до заключения новых крупных сделок. Наконец, предполагалось, что ИИ-компании боятся дистилляции моделей, когда конкуренты, особенно разработчики опенсорсных решений и китайские лаборатории, используют ответы передовой нейросети для обучения собственных систем.

После того как Anthropic официально встроила ограничения для ИИ-исследователей в коммерческий релиз Mythos, третья теория о защите от конкурентов стала выглядеть наиболее правдоподобно.

Anthropic выпустила Claude Fable 5 — публичную версию нашумевшей Mythos

Вопреки Трампу и пошлинам: OpenAI Anthropic и Nvidia резко увеличили наём иностранных специалистов

CEO Anthropic: почти половина моей работы — культура компании а не разработка ИИ

Оставить комментарий

Текст: Алеся Чапкевич Фото: Jan Antonin Kolar / Unsplash Источник: Business Insider Теги: anthropic, mythos, claude fable, искусственный интеллект, этика

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."