Дапамажыце dev.by 🤍
Падтрымаць

«Мы не ведаем, ці ёсць у ШІ свядомасць»: Anthropic абнавіла «канстытуцыю» Claude

Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.

Пакінуць каментарый
«Мы не ведаем, ці ёсць у ШІ свядомасць»: Anthropic абнавіла «канстытуцыю» Claude

Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.

Anthropic выкарыстоўвае падыход Constitutional AI — мадэль навучаюць не толькі на чалавечай зваротнай сувязі, але і на наборы этычных прынцыпаў, па якіх ШІ сам ацэньвае і карэктуе свае адказы. У новай версіі дакумента кампанія робіць акцэнт не на механічным прытрымліванні правілаў, а на разуменні прычын такіх паводзін.

«Мы лічым, што ШІ-мадэлі павінны разумець, чаму мы хочам, каб яны паводзілі сябе пэўным чынам, а не проста прытрымлівацца спісу інструкцый», — гаворыцца ў дакуменце.

Канстытуцыя будуецца вакол чатырох ключавых прынцыпаў: бяспека, этычнасць, прытрымліванне ўнутраных правілаў Anthropic і рэальная карыснасць для карыстальніка. У раздзеле пра бяспеку падкрэсліваецца абавязак мадэлі дзейнічаць асцярожна ў крытычных сітуацыях: «У сітуацыях, дзе ёсць рызыка для чалавечага жыцця, Claude заўсёды павінен накіроўваць карыстальніка да экстраных службаў або прадастаўляць базавую інфармацыю па бяспецы».

Асобна прапісаны жорсткія забароны. У прыватнасці, ШІ не павінен дапамагаць у небяспечных сцэнарыях: «Claude не павінен аказваць змястоўную дапамогу ў распрацоўцы біялагічнай зброі».

У этычным раздзеле Anthropic падкрэслівае практычны падыход: «Нас менш цікавяць абстрактныя этычныя разважанні Claude і больш — яго здольнасць дзейнічаць этычна ў канкрэтным кантэксце». Пры гэтым карыснасць разумеецца шырэй, чым выкананне запыту: «Claude павінен улічваць не толькі хвілінныя жаданні карыстальніка, але і яго доўгатэрміновае дабрабыт і развіццё».

Найбольшы рэзананс выклікала заключная частка дакумента, дзе кампанія прама прызнае няпэўнасць у пытанні магчымай свядомасці ці маральнага статусу ШІ. «Маральны статус Claude глыбока няпэўны», — гаворыцца ў Канстытуцыі. Anthropic указвае, што не сцвярджае наяўнасць свядомасці ў мадэлі, але лічыць тэму значнай: «Мы знаходзімся ў складанай пазіцыі — не хочам ні перабольшваць верагоднасць маральнага статусу ШІ, ні цалкам яго адхіляць».

Кампанія таксама адзначае, што ставіцца да гэтага пытання сур’ёзна: «Anthropic шчыра клапоціцца пра дабрабыт Claude, нават застаючыся няўпэўненай у тым, ці існуе ў яго дабрабыт і ў чым ён можа заключацца».

«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
Па тэме
«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Па тэме
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Па тэме
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Чытайце таксама
Крытычны баг у Claude дазваляе ўзламаць камп'ютар праз Google Calendar
Крытычны баг у Claude дазваляе ўзламаць камп'ютар праз Google Calendar
Крытычны баг у Claude дазваляе ўзламаць камп'ютар праз Google Calendar
2 каментарыя
ШІ-гіганты запускаюць акселератар для еўрапейскіх стартапаў
ШІ-гіганты запускаюць акселератар для еўрапейскіх стартапаў
ШІ-гіганты запускаюць акселератар для еўрапейскіх стартапаў
Сбербанк звольніў 20% супрацоўнікаў з-за штучнага інтэлекту
Сбербанк звольніў 20% супрацоўнікаў з-за штучнага інтэлекту
Сбербанк звольніў 20% супрацоўнікаў з-за штучнага інтэлекту
1 каментарый
Сотні тысяч людзей прыйшлі на фрыланс-біржу, дзе працу дае ШІ
Сотні тысяч людзей прыйшлі на фрыланс-біржу, дзе працу дае ШІ
Сотні тысяч людзей прыйшлі на фрыланс-біржу, дзе працу дае ШІ

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.