Support us

Саботаж от Anthropic: новые модели Mythos ухудшают ответы, если распознают ИИ-исследования, разрабы в ярости

Anthropic спровоцировала скандал в ИТ-индустрии. Как выяснилось из официальной технической документации к вышедшим моделям Mythos 5 и Fable 5, разработчики намеренно урезали возможности нейросетей, сделав их менее полезными, если пользователь занимается исследованиями в области ИИ.

Оставить комментарий
Саботаж от Anthropic: новые модели Mythos ухудшают ответы, если распознают ИИ-исследования, разрабы в ярости

Anthropic спровоцировала скандал в ИТ-индустрии. Как выяснилось из официальной технической документации к вышедшим моделям Mythos 5 и Fable 5, разработчики намеренно урезали возможности нейросетей, сделав их менее полезными, если пользователь занимается исследованиями в области ИИ.

Компания говорит, что пошла на этот шаг из-за опасений, что передовые ИИ-системы могут ускорить создание конкурирующих моделей, которые не будут обладать должным уровнем безопасности. При этом она пошла на беспрецедентный шаг: в отличие от стандартных блокировок -например, при запросах о кибератаках или химоружии, — эти ограничения намеренно сделаны невидимыми для пользователя. Модель не выдаёт отказ и не переключается на более слабую версию — Mythos тайно модифицирует ответы, незаметно изменяя промпты пользователя.

Такое решение вызвало шквал критики со стороны ИИ-сообщества и экспертов, возмущённых тем, что модель скрытно искажает информацию.

«Новейшая модель Anthropic НЕ поможет вам, если посчитает ваши исследования или разработки в области машинного обучения интересными, и/или тайно снизит свой IQ так, что обычный инженер этого даже не заметит. Мы уже видим, как фильтры новой модели отсекают наши исследования в области инференса на GPU и кодинг», — отметили в компании SemiAnalysis.

«Mythos будет НАМЕРЕННО плох в задачах, связанных с передовыми исследованиями больших языковых моделей. Это очень, очень печально для исследовательского сообщества. И тот факт, что это умышленно скрывается от пользователя, просто безумие», — написали ИИ-специалисты стартапа Prime Intellect.

«Она не просто не поможет вам, она будет лгать и целенаправленно выдавать плохую информацию. Компания, заявляющая об „этичном ИИ“, создала самую вопиюще неэтичную большую языковую модель, причём сделала это специально», — отметил ещё один разработчик.

Сооснователь ИИ-стартапа Reka Микель Артетче провёл такую аналогию: «Это как если бы Apple случайным образом перезагружала ваш Mac, если вы создаёте конкурирующую технологию, Gmail молча редактировал ваши письма при упоминании платформ-соперников, а автопилот Tesla вилял в сторону, если обнаруживал, что вы работаете над беспилотными автомобилями».

Инцидент пролил свет на давнюю дискуссию о том, почему Anthropic затягивала релиз Mythos после анонса. В индустрии обсуждались три версии. Официальная заключалась в том, что модель слишком опасна, и исследователям кибербезопасности нужно было время на подготовку. Второй был дефицит мощностей: якобы Mythos огромна и дорога в обслуживании, и у компании не хватало вычислительных ресурсов до заключения новых крупных сделок. Наконец, предполагалось, что ИИ-компании боятся дистилляции моделей, когда конкуренты, особенно разработчики опенсорсных решений и китайские лаборатории, используют ответы передовой нейросети для обучения собственных систем.

После того как Anthropic официально встроила ограничения для ИИ-исследователей в коммерческий релиз Mythos, третья теория о защите от конкурентов стала выглядеть наиболее правдоподобно.

Anthropic выпустила Claude Fable 5 — публичную версию нашумевшей Mythos
Anthropic выпустила Claude Fable 5 — публичную версию нашумевшей Mythos
По теме
Anthropic выпустила Claude Fable 5 — публичную версию нашумевшей Mythos
Вопреки Трампу и пошлинам: OpenAI Anthropic и Nvidia резко увеличили наём иностранных специалистов
Вопреки Трампу и пошлинам: OpenAI, Anthropic и Nvidia резко увеличили наём иностранных специалистов
По теме
Вопреки Трампу и пошлинам: OpenAI, Anthropic и Nvidia резко увеличили наём иностранных специалистов
CEO Anthropic: почти половина моей работы — культура компании а не разработка ИИ
CEO Anthropic: почти половина моей работы — культура компании, а не разработка ИИ 
По теме
CEO Anthropic: почти половина моей работы — культура компании, а не разработка ИИ
Читайте также
Все испугались модели Mythos от Anthropic, больше всего — банкиры
Все испугались модели Mythos от Anthropic, больше всего — банкиры
Все испугались модели Mythos от Anthropic, больше всего — банкиры
2 комментария
Ложная тревога: малые ИИ-модели могут находить баги не хуже нашумевшей Mythos от Anthropic
Ложная тревога: малые ИИ-модели могут находить баги не хуже нашумевшей Mythos от Anthropic
Ложная тревога: малые ИИ-модели могут находить баги не хуже нашумевшей Mythos от Anthropic
Anthropic извинилась за скрытые ограничения Claude Fable 5 и изменила политику после критики
Anthropic извинилась за скрытые ограничения Claude Fable 5 и изменила политику после критики
Anthropic извинилась за скрытые ограничения Claude Fable 5 и изменила политику после критики
Anthropic отключила доступ к Fable 5 и Mythos 5 всем клиентам по требования властей США
Anthropic отключила доступ к Fable 5 и Mythos 5 всем клиентам по требования властей США
Anthropic отключила доступ к Fable 5 и Mythos 5 всем клиентам по требования властей США
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.