Дапамажыце dev.by 🤍
Падтрымаць

+80%. Anthropic сцвярджае, што яе ШІ значна паскарае працу

Anthropic прааналізавала 100 тысяч рэальных дыялогаў з Claude, каб ацаніць яго ўплыў на прадукцыйнасць працы. Паводле кампаніі, задачы, на выкананне якіх без ШІ сыходзіць у сярэднім 90 хвілін, з ШІ займаюць толькі 18 хвілін, гэта значыць на 80%.

2 каментарыя
+80%. Anthropic сцвярджае, што яе ШІ значна паскарае працу

Anthropic прааналізавала 100 тысяч рэальных дыялогаў з Claude, каб ацаніць яго ўплыў на прадукцыйнасць працы. Паводле кампаніі, задачы, на выкананне якіх без ШІ сыходзіць у сярэднім 90 хвілін, з ШІ займаюць толькі 18 хвілін, гэта значыць на 80%.

У адным дыялогу чат-бот выконвае працу, якая каштуе прыблізна $55 чалавечай працы (гэта медыяна). Калі экстрапаляваць высновы даследчыкаў на эканоміку ЗША, то цяперашняе пакаленне ШІ-мадэляў магло б павялічыць штогадовы прырост прадукцыйнасці на 1,8% у бліжэйшае дзесяцігоддзе — гэта прыкладна ўдвая вышэй за тэмпы апошніх гадоў.

Аўтары адзначаюць, што выгада размяркоўваецца вельмі нераўнамерна. Самы вялікі ўклад у агульную статыстыку па прыросце прадукцыйнасці ўносяць распрацоўшчыкі софту (19%), менеджары, маркетолагі, спецыялісты па працы з кліентамі і настаўнікі. У грамадскім харчаванні, некаторых медыцынскіх задачах, будаўніцтве і рознічным гандлі ўплыў ШІ на прадукцыйнасць вельмі невялікі.

Самая вялікая эканомія па часе зафіксавана ў менеджменце і юрыдычных задачах — 2 гадзіны і 1,8 гадзіны адпаведна.

Anthropic выпусціла «лепшую мадэль для кодынгу ў свеце»
Anthropic выпусціла «лепшую мадэль для кодынгу ў свеце»
Па тэме
Anthropic выпусціла «лепшую мадэль для кодынгу ў свеце»
ШІ-агент Anthropic вырашыў што стаў ахвярай махляроў і выклікаў ФБР
ШІ-агент Anthropic вырашыў, што стаў ахвярай махляроў, і выклікаў ФБР
Па тэме
ШІ-агент Anthropic вырашыў, што стаў ахвярай махляроў, і выклікаў ФБР
Чытайце таксама
Стваральнік Claude Code паказаў, як вайбкодзіць. Камьюніці загудзела
Стваральнік Claude Code паказаў, як вайбкодзіць. Камьюніці загудзела
Стваральнік Claude Code паказаў, як вайбкодзіць. Камьюніці загудзела
ШІ спрабуе самазахоўвацца, і гэта небяспечна — «хросны бацька» ШІ
ШІ спрабуе самазахоўвацца, і гэта небяспечна — «хросны бацька» ШІ
ШІ спрабуе самазахоўвацца, і гэта небяспечна — «хросны бацька» ШІ
Быць «адзінарогам» ужо не модна — надыходзіць эра «гектарогаў»
Быць «адзінарогам» ужо не модна — надыходзіць эра «гектарогаў»
Быць «адзінарогам» ужо не модна — надыходзіць эра «гектарогаў»
Ад камбучы да сайд-праектаў: Anthropic любіць наймаць інжынераў з незвычайнымі хобі
Ад камбучы да сайд-праектаў: Anthropic любіць наймаць інжынераў з незвычайнымі хобі
Ад камбучы да сайд-праектаў: Anthropic любіць наймаць інжынераў з незвычайнымі хобі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

1

https://4pda.to/2025/11/25/449848/ii_puzyr_prodolzhaet_rasshiryatsya_chto_zametili_eksperty/ (да неужето 😏) "Отчёт METR, посвящённый программированию, подтверждает этот вывод. Написание кода — сфера, которой прочили автоматизацию в первую очередь. Однако выяснилось, что генеративные инструменты нередко замедляют работу. Нейронки допускают ошибки, и разработчик может потратить больше времени на отладку такого кода, чем на выполнение задания самому с нуля."

"Проблема касается не только IT-сектора. Согласно опросу Harvard Business Review, 40% американских работников разных отраслей вынуждены взаимодействовать с так называемым «рабочим шлаком» (workslop) — искусственным контентом, который не несет пользы, а только имитирует её. Причин несколько: из-за «галлюцинаций» ИИ не может быть на 100% точен, где это необходимо. Нарушается коммуникация между экспертами и руководством, а сам ИИ-помощник — ещё одно звено, на управление которым приходится выделять энергию и время."

"Эксперты Microsoft и MIT Sloan выявили неутешительную корреляцию: частое применение нейросетей притупляет критическое мышление. Опытные сотрудники, делегирующие задачи алгоритмам, хотя и могут выиграть время, со временем теряют экспертизу. Когнитивная разгрузка — главный бонус ИИ, который в то же время не обходится без последствий. Если человек в начале карьеры уже полагается на него, он мешает себе приобрести профессиональные навыки специалиста."

"Это создаёт опасную тенденцию: менеджеры, которые всё больше полагаются на отчёты ИИ, теряют способность адекватно оценивать реальное положение дел и контролировать качество работы.
Тем не менее в руководстве часто закрывают глаза на нюансы и хотят верить, что ИИ повышает продуктивность. По информации Upwork, в 2024 году так думали 96% топ-менеджеров, тогда как 77% рядовых сотрудников заявили, что нейросети только добавили им лишних хлопот. А кое-где имело место желание сэкономить на персонале в тяжёлые времена. Финтех-стартап Klarna сократил 700 работников, но вскоре после ухудшения сервиса захотел вернуть часть из них назад. Duolingo — аналогичный прецедент."

"Рентабельность инфраструктуры ИИ также вызывает вопросы. По прогнозам, для окупаемости запланированных дата-центров отрасль должна генерировать 2 триллиона долларов годового дохода к 2030-му. Однако сейчас отрыв до компенсации убытков оценивается в $800 млрд долларов. Бизнес-модели подписок, приложений и браузеров пока не позволяют даже выйти в ноль." Нужно поднимать стоимость подписок до $2000 также экспоненциально - тогда окупится наверное. "Существует вероятность, что будущие поколения моделей не станут сильно лучше нынешних. Работает закон убывающей отдачи: для линейного улучшения качества требуются экспоненциальные затраты на вычисления. Вдобавок недавние исследования OpenAI показали, что простое увеличение объёма данных и мощностей не уменьшает галлюцинации. Модели становятся дороже, но не надёжнее."

Zhan Chubukou
Zhan Chubukou Шчолкаю зубамі в ЗАО "Прыдацелі і атшчыпенцы"
0

Мне работу очень ускоряет GLM-4.6. Потому как пишет и думает почти как Claude Opus-4.1, а стоит намного дешевле и не пытается вступать в интимные отношения с моим головным мозгом за счёт "эмоционального вовлечения", а вместо смайликов и прочего мусора пишет ответы и код в запрошенном формате.

Карыстальнік адрэдагаваў каментарый 28 лістапада 2025, 00:26