Дапамажыце dev.by 🤍
Падтрымаць

Anthropic выбачылася за схаваныя абмежаванні Claude і змяніла палітыку пасля крытыкі

Кампанія адмовілася ад спрэчнай палітыкі, якая магла схавана абмяжоўваць працу Claude Fable 5 для даследчыкаў, якія выкарыстоўваюць мадэль пры распрацоўцы іншых ШІ-сістэм.

Пакінуць каментарый
Anthropic выбачылася за схаваныя абмежаванні Claude і змяніла палітыку пасля крытыкі

Кампанія адмовілася ад спрэчнай палітыкі, якая магла схавана абмяжоўваць працу Claude Fable 5 для даследчыкаў, якія выкарыстоўваюць мадэль пры распрацоўцы іншых ШІ-сістэм.

Claude Fable 5 — першая агульнадаступная мадэль Anthropic узроўню Mythos, але з дадатковымі ахоўнымі абмежаваннямі. Частка абмежаванняў датычылася відавочна рызыкоўных галінаў, у тым ліку кібербяспекі, біялогіі і хіміі. У такіх выпадках Anthropic можа перанакіроўваць запыты на менш магутную мадэль.

Аднак для запытаў, звязаных з распрацоўкай перадавых мадэляў, кампанія першапачаткова выбрала іншы механізм: Claude магла незаўважна пагаршаць якасць адказаў. Карыстальнік пры гэтым не бачыў бы, што спрацавала абмежаванне.

Крытыкі палічылі такі падыход схаваным умяшаннем у працу даследчыкаў. На іхную думку, гэта магло перашкодзіць распрацоўцы канкуруючых мадэляў, а таксама праектам у галіне адкрытага ШІ і бяспекі мадэляў.

Пасля абмеркавання Anthropic прызнала памылку. «Мы мяняем ахоўныя механізмы Fable 5 для распрацоўкі францірных LLM, каб яны былі бачнымі. Мы выбралі няправільны кампраміс і выбачаемся за тое, што не знайшлі правільны баланс», — заявіла кампанія.

Anthropic выпустила Claude Fable 5 — публичную версию нашумевшей Mythos
Anthropic выпусціла Claude Fable 5 — публічную версію нашумелай Mythos
Па тэме
Anthropic выпусціла Claude Fable 5 — публічную версію нашумелай Mythos

Цяпер, калі Anthropic вырашыць, што карыстальнік спрабуе выкарыстаць Claude Fable 5 для распрацоўкі магутнай ШІ-мадэлі, сістэма павінна будзе відавочна паведаміць пра адмову або перанакіраванне запыту на менш магутную мадэль.

Адзін з галоўных аргументаў крытыкаў заключаўся ў тым, што схаванае пагаршэнне працы мадэлі пакідала даследчыкаў у няведанні. Яны маглі не разумець, ці парушаюць правілы Anthropic, чаму мадэль горш спраўляецца з задачай і ці можна давяраць вынікам.

«Схавана пагаршаць прадукцыйнасць у ML-даследаваннях без папярэджання карыстальніка — шакуюча варожа і выглядае жахліва», — напісаў у X Дзін Бол, старшы навуковы супрацоўнік Foundation for American Innovation і былы дарадца Белага дома па ШІ.

Даследчык Уіл Браўн з ШІ-стартапу Prime Intellect заявіў, што палітыка выглядала так, быццам Anthropic лічыць толькі сябе вартай займацца прасунутымі даследаваннямі ШІ. На ягоную думку, гэта нагадвала сітуацыю, у якой кампанія «падцягвае лесвіцу за сабой».

Три главных качества которые Anthropic ищет в кандидатах
Тры галоўныя якасці, якія Anthropic шукае ў кандыдатаў
Па тэме
Тры галоўныя якасці, якія Anthropic шукае ў кандыдатаў
Microsoft запретила сотрудникам использовать Claude Fable 5: смутила политика данных Anthropic
Microsoft забараніла супрацоўнікам выкарыстоўваць Claude Fable 5: збянтэжыла палітыка даных Anthropic
Па тэме
Microsoft забараніла супрацоўнікам выкарыстоўваць Claude Fable 5: збянтэжыла палітыка даных Anthropic
Исследователи обучили ИИ-модель с нуля всего за $1500
Даследчыкі навучылі ІІ-мадэль з нуля ўсяго за $1500
Па тэме
Даследчыкі навучылі ІІ-мадэль з нуля ўсяго за $1500
Чытайце таксама
Anthropic паказала магутны ШІ для пошуку ўразлівасцяў, але трымае яго закрытым
Anthropic паказала магутны ШІ для пошуку ўразлівасцяў, але трымае яго закрытым
Anthropic паказала магутны ШІ для пошуку ўразлівасцяў, але трымае яго закрытым
Anthropic выпусціла Claude Fable 5 — публічную версію нашумелай Mythos
Anthropic выпусціла Claude Fable 5 — публічную версію нашумелай Mythos
Anthropic выпусціла Claude Fable 5 — публічную версію нашумелай Mythos
Microsoft забараніла супрацоўнікам выкарыстоўваць Claude Fable 5: кампанію занепакоіла палітыка дадзеных Anthropic
Microsoft забараніла супрацоўнікам выкарыстоўваць Claude Fable 5: кампанію занепакоіла палітыка дадзеных Anthropic
Microsoft забараніла супрацоўнікам выкарыстоўваць Claude Fable 5: кампанію занепакоіла палітыка дадзеных Anthropic
1 каментарый
Anthropic выбачылася за схаваныя абмежаванні Claude і змяніла палітыку пасля крытыкі
Anthropic выбачылася за схаваныя абмежаванні Claude і змяніла палітыку пасля крытыкі
Anthropic выбачылася за схаваныя абмежаванні Claude і змяніла палітыку пасля крытыкі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.