🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Не просите ИИ «побыть экспертом» — кодинг становится только хуже

Исследователи выяснили, что популярный прием в работе с ИИ — просить модель «представить себя экспертом» — может ухудшать результаты, особенно в задачах программирования и математики.

Оставить комментарий
Не просите ИИ «побыть экспертом» — кодинг становится только хуже

Исследователи выяснили, что популярный прием в работе с ИИ — просить модель «представить себя экспертом» — может ухудшать результаты, особенно в задачах программирования и математики.

Речь идет о ситуации, когда пользователь добавляет в запрос фразы вроде «ты опытный разработчик» или «ты эксперт по машинному обучению». Этот метод широко распространился с 2023 года и стал стандартом во многих гайдах по работе с ИИ.

Однако новое исследование ученых из Университета Южной Калифорнии показало, что такой подход работает не всегда. Исследователи пришли к выводу, что «роль эксперта» может даже снижать точность ответов.

По их данным, при тестировании на бенчмарке MMLU модели с «экспертной персоной» показали худшие результаты, чем базовые версии: точность составила 68% против 71,6%. «Когда модель просят выбрать правильный ответ, „экспертная“ версия стабильно уступает базовой модели», — отмечают авторы.

Причина в том, что подобные инструкции не добавляют модели реальных знаний. Напротив, они могут мешать ей извлекать факты из обучающих данных. Исследователи предполагают, что такие формулировки переключают модель в режим следования инструкциям вместо точного воспроизведения информации.

«Убери себя как узкое место»: автор «вайб-кодинга» заявил о новой роли людей в ИИ-разработке
«Убери себя как узкое место»: автор «вайб-кодинга» заявил о новой роли людей в ИИ-разработке
По теме
«Убери себя как узкое место»: автор «вайб-кодинга» заявил о новой роли людей в ИИ-разработке

При этом эффект зависит от типа задачи. В заданиях, связанных с безопасностью, стилем или соответствием правилам, «персона» действительно помогает. Например, отдельная роль «эксперта безопасности» увеличила долю отказов от опасных запросов почти на 18 процентных пунктов.

Один из авторов исследования, аспирант Цзычжао Ху, пояснил, что в программировании такой подход бесполезен: «Просьба к модели быть экспертом-программистом не улучшает качество кода». Вместо этого, по его словам, лучше давать конкретные требования к задаче, например, описывать архитектуру проекта или предпочтения по инструментам.

Ученые также предложили альтернативный метод — PRISM, который позволяет использовать «персоны» только там, где они действительно помогают, и отключать их в задачах, требующих точности.

Главный вывод исследования — универсальных формул для промптов не существует. «Если вам важна точность и факты — не добавляйте лишних инструкций. Если важна структура и соблюдение правил — будьте максимально конкретны», — резюмируют авторы.

Cursor выпустила новую кодинг-модель — дешёвую альтернативу Codex и Claude Code
Cursor выпустила новую кодинг-модель — дешёвую альтернативу Codex и Claude Code
По теме
Cursor выпустила новую кодинг-модель — дешёвую альтернативу Codex и Claude Code
Топ-модели для кодинга ошибаются в четверти случаев — исследование
Топ-модели для кодинга ошибаются в четверти случаев — исследование
По теме
Топ-модели для кодинга ошибаются в четверти случаев — исследование
Две угрозы мешают буму вайб-кодинга — мнение главы вайб-стартапа
Две угрозы мешают буму вайб-кодинга — мнение главы вайб-стартапа
По теме
Две угрозы мешают буму вайб-кодинга — мнение главы вайб-стартапа
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Студенты уже начали менять специальности из-за ИИ, половина — задумывались
Студенты уже начали менять специальности из-за ИИ, половина — задумывались
Студенты уже начали менять специальности из-за ИИ, половина — задумывались
Главная ошибка CEO в работе с ИИ — мнение эксперта
Главная ошибка CEO в работе с ИИ — мнение эксперта
Главная ошибка CEO в работе с ИИ — мнение эксперта
«Это не карьерная лестница, а стена»: топ LinkedIn о будущем карьеры в эпоху ИИ
«Это не карьерная лестница, а стена»: топ LinkedIn о будущем карьеры в эпоху ИИ
«Это не карьерная лестница, а стена»: топ LinkedIn о будущем карьеры в эпоху ИИ
Slack обновили по-крупному — более 30 новых ИИ-функций
Slack обновили по-крупному — более 30 новых ИИ-функций
Slack обновили по-крупному — более 30 новых ИИ-функций
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.