Дапамажыце dev.by 🤍
Падтрымаць

«Мы не ведаем, ці ёсць у ШІ свядомасць»: Anthropic абнавіла «канстытуцыю» Claude

Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.

Пакінуць каментарый
«Мы не ведаем, ці ёсць у ШІ свядомасць»: Anthropic абнавіла «канстытуцыю» Claude

Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.

Anthropic выкарыстоўвае падыход Constitutional AI — мадэль навучаюць не толькі на чалавечай зваротнай сувязі, але і на наборы этычных прынцыпаў, па якіх ШІ сам ацэньвае і карэктуе свае адказы. У новай версіі дакумента кампанія робіць акцэнт не на механічным прытрымліванні правілаў, а на разуменні прычын такіх паводзін.

«Мы лічым, што ШІ-мадэлі павінны разумець, чаму мы хочам, каб яны паводзілі сябе пэўным чынам, а не проста прытрымлівацца спісу інструкцый», — гаворыцца ў дакуменце.

Канстытуцыя будуецца вакол чатырох ключавых прынцыпаў: бяспека, этычнасць, прытрымліванне ўнутраных правілаў Anthropic і рэальная карыснасць для карыстальніка. У раздзеле пра бяспеку падкрэсліваецца абавязак мадэлі дзейнічаць асцярожна ў крытычных сітуацыях: «У сітуацыях, дзе ёсць рызыка для чалавечага жыцця, Claude заўсёды павінен накіроўваць карыстальніка да экстраных службаў або прадастаўляць базавую інфармацыю па бяспецы».

Асобна прапісаны жорсткія забароны. У прыватнасці, ШІ не павінен дапамагаць у небяспечных сцэнарыях: «Claude не павінен аказваць змястоўную дапамогу ў распрацоўцы біялагічнай зброі».

У этычным раздзеле Anthropic падкрэслівае практычны падыход: «Нас менш цікавяць абстрактныя этычныя разважанні Claude і больш — яго здольнасць дзейнічаць этычна ў канкрэтным кантэксце». Пры гэтым карыснасць разумеецца шырэй, чым выкананне запыту: «Claude павінен улічваць не толькі хвілінныя жаданні карыстальніка, але і яго доўгатэрміновае дабрабыт і развіццё».

Найбольшы рэзананс выклікала заключная частка дакумента, дзе кампанія прама прызнае няпэўнасць у пытанні магчымай свядомасці ці маральнага статусу ШІ. «Маральны статус Claude глыбока няпэўны», — гаворыцца ў Канстытуцыі. Anthropic указвае, што не сцвярджае наяўнасць свядомасці ў мадэлі, але лічыць тэму значнай: «Мы знаходзімся ў складанай пазіцыі — не хочам ні перабольшваць верагоднасць маральнага статусу ШІ, ні цалкам яго адхіляць».

Кампанія таксама адзначае, што ставіцца да гэтага пытання сур’ёзна: «Anthropic шчыра клапоціцца пра дабрабыт Claude, нават застаючыся няўпэўненай у тым, ці існуе ў яго дабрабыт і ў чым ён можа заключацца».

«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
Па тэме
«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Па тэме
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Па тэме
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Чытайце таксама
Маск: не карыстайцеся ChatGPT, ён забівае. Альтман: а як наконт Tesla?
Маск: не карыстайцеся ChatGPT, ён забівае. Альтман: а як наконт Tesla?
Маск: не карыстайцеся ChatGPT, ён забівае. Альтман: а як наконт Tesla?
Autodesk скарачае 1000 чалавек. Здагадайцеся, куды пойдуць зэканомленыя грошы
Autodesk скарачае 1000 чалавек. Здагадайцеся, куды пойдуць зэканомленыя грошы
Autodesk скарачае 1000 чалавек. Здагадайцеся, куды пойдуць зэканомленыя грошы
1 каментарый
HR-дырэктар Cisco: горшае, што могуць зрабіць кампаніі, — наваліць на супрацоўнікаў болей працы, бо ШІ эканоміць час
HR-дырэктар Cisco: горшае, што могуць зрабіць кампаніі, — наваліць на супрацоўнікаў болей працы, бо ШІ эканоміць час
HR-дырэктар Cisco: горшае, што могуць зрабіць кампаніі, — наваліць на супрацоўнікаў болей працы, бо ШІ эканоміць час
«Вы будзеце працаваць яшчэ больш»: эксперт — пра міф чатырохдзёнкі
«Вы будзеце працаваць яшчэ больш»: эксперт — пра міф чатырохдзёнкі
«Вы будзеце працаваць яшчэ больш»: эксперт — пра міф чатырохдзёнкі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.