Дапамажыце dev.by 🤍
Падтрымаць

«Мы не ведаем, ці ёсць у ШІ свядомасць»: Anthropic абнавіла «канстытуцыю» Claude

Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.

Пакінуць каментарый
«Мы не ведаем, ці ёсць у ШІ свядомасць»: Anthropic абнавіла «канстытуцыю» Claude

Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.

Anthropic выкарыстоўвае падыход Constitutional AI — мадэль навучаюць не толькі на чалавечай зваротнай сувязі, але і на наборы этычных прынцыпаў, па якіх ШІ сам ацэньвае і карэктуе свае адказы. У новай версіі дакумента кампанія робіць акцэнт не на механічным прытрымліванні правілаў, а на разуменні прычын такіх паводзін.

«Мы лічым, што ШІ-мадэлі павінны разумець, чаму мы хочам, каб яны паводзілі сябе пэўным чынам, а не проста прытрымлівацца спісу інструкцый», — гаворыцца ў дакуменце.

Канстытуцыя будуецца вакол чатырох ключавых прынцыпаў: бяспека, этычнасць, прытрымліванне ўнутраных правілаў Anthropic і рэальная карыснасць для карыстальніка. У раздзеле пра бяспеку падкрэсліваецца абавязак мадэлі дзейнічаць асцярожна ў крытычных сітуацыях: «У сітуацыях, дзе ёсць рызыка для чалавечага жыцця, Claude заўсёды павінен накіроўваць карыстальніка да экстраных службаў або прадастаўляць базавую інфармацыю па бяспецы».

Асобна прапісаны жорсткія забароны. У прыватнасці, ШІ не павінен дапамагаць у небяспечных сцэнарыях: «Claude не павінен аказваць змястоўную дапамогу ў распрацоўцы біялагічнай зброі».

У этычным раздзеле Anthropic падкрэслівае практычны падыход: «Нас менш цікавяць абстрактныя этычныя разважанні Claude і больш — яго здольнасць дзейнічаць этычна ў канкрэтным кантэксце». Пры гэтым карыснасць разумеецца шырэй, чым выкананне запыту: «Claude павінен улічваць не толькі хвілінныя жаданні карыстальніка, але і яго доўгатэрміновае дабрабыт і развіццё».

Найбольшы рэзананс выклікала заключная частка дакумента, дзе кампанія прама прызнае няпэўнасць у пытанні магчымай свядомасці ці маральнага статусу ШІ. «Маральны статус Claude глыбока няпэўны», — гаворыцца ў Канстытуцыі. Anthropic указвае, што не сцвярджае наяўнасць свядомасці ў мадэлі, але лічыць тэму значнай: «Мы знаходзімся ў складанай пазіцыі — не хочам ні перабольшваць верагоднасць маральнага статусу ШІ, ні цалкам яго адхіляць».

Кампанія таксама адзначае, што ставіцца да гэтага пытання сур’ёзна: «Anthropic шчыра клапоціцца пра дабрабыт Claude, нават застаючыся няўпэўненай у тым, ці існуе ў яго дабрабыт і ў чым ён можа заключацца».

«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
Па тэме
«Мы ўжо гэта бачым»: кіраўнікі Google DeepMind і Anthropic пра замену джуноў на ШІ
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Па тэме
Офісны ШІ-агент Anthropic умее красці файлы праз схаваныя каманды
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Па тэме
Anthropic прадставіла медыцынскі Claude — свой адказ ChatGPT Health
Чытайце таксама
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Боты абагналі людзей: ШІ стаў галоўнай крыніцай трафіку ў інтэрнэце
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Meta кажа, што ЗША патрэбна паўмільёна электрыкаў для патрэб ШІ
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі
Meta прымушае супрацоўнікаў выкарыстоўваць ШІ. Вось якія планкі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.