«Мы не ведаем, ці ёсць у ШІ свядомасць»: Anthropic абнавіла «канстытуцыю» Claude
Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.
Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.
Кампанія апублікавала абноўленую «Канстытуцыю» чат-бота Claude — базавы дакумент, які апісвае прынцыпы работы і паводзін мадэлі.
Anthropic выкарыстоўвае падыход Constitutional AI — мадэль навучаюць не толькі на чалавечай зваротнай сувязі, але і на наборы этычных прынцыпаў, па якіх ШІ сам ацэньвае і карэктуе свае адказы. У новай версіі дакумента кампанія робіць акцэнт не на механічным прытрымліванні правілаў, а на разуменні прычын такіх паводзін.
«Мы лічым, што ШІ-мадэлі павінны разумець, чаму мы хочам, каб яны паводзілі сябе пэўным чынам, а не проста прытрымлівацца спісу інструкцый», — гаворыцца ў дакуменце.
Канстытуцыя будуецца вакол чатырох ключавых прынцыпаў: бяспека, этычнасць, прытрымліванне ўнутраных правілаў Anthropic і рэальная карыснасць для карыстальніка. У раздзеле пра бяспеку падкрэсліваецца абавязак мадэлі дзейнічаць асцярожна ў крытычных сітуацыях: «У сітуацыях, дзе ёсць рызыка для чалавечага жыцця, Claude заўсёды павінен накіроўваць карыстальніка да экстраных службаў або прадастаўляць базавую інфармацыю па бяспецы».
Асобна прапісаны жорсткія забароны. У прыватнасці, ШІ не павінен дапамагаць у небяспечных сцэнарыях: «Claude не павінен аказваць змястоўную дапамогу ў распрацоўцы біялагічнай зброі».
У этычным раздзеле Anthropic падкрэслівае практычны падыход: «Нас менш цікавяць абстрактныя этычныя разважанні Claude і больш — яго здольнасць дзейнічаць этычна ў канкрэтным кантэксце». Пры гэтым карыснасць разумеецца шырэй, чым выкананне запыту: «Claude павінен улічваць не толькі хвілінныя жаданні карыстальніка, але і яго доўгатэрміновае дабрабыт і развіццё».
Найбольшы рэзананс выклікала заключная частка дакумента, дзе кампанія прама прызнае няпэўнасць у пытанні магчымай свядомасці ці маральнага статусу ШІ. «Маральны статус Claude глыбока няпэўны», — гаворыцца ў Канстытуцыі. Anthropic указвае, што не сцвярджае наяўнасць свядомасці ў мадэлі, але лічыць тэму значнай: «Мы знаходзімся ў складанай пазіцыі — не хочам ні перабольшваць верагоднасць маральнага статусу ШІ, ні цалкам яго адхіляць».
Кампанія таксама адзначае, што ставіцца да гэтага пытання сур’ёзна: «Anthropic шчыра клапоціцца пра дабрабыт Claude, нават застаючыся няўпэўненай у тым, ці існуе ў яго дабрабыт і ў чым ён можа заключацца».



Релоцировались? Теперь вы можете комментировать без верификации аккаунта.