Cloud VPS без компромиссов: обзор Zomro
Support us

Почему ИИ быстрее учится писать код, чем письма: что такое «разрыв подкрепления»

ИИ стремительно умнеет, но не во всём одинаково. За последние месяцы модели вроде GPT-5, Gemini 2.5 и Sonnet 4.5 сделали гигантский скачок в программировании — теперь они не просто помогают писать код, а способны брать на себя целые куски работы.

А вот генераторы писем, кажется, застряли на месте по сравнению с тем, что было год назад — или чат-боты, которым приходится жонглировать десятком разных задач, пишет TechCrunch.

Оставить комментарий

ИИ стремительно умнеет, но не во всём одинаково. За последние месяцы модели вроде GPT-5, Gemini 2.5 и Sonnet 4.5 сделали гигантский скачок в программировании — теперь они не просто помогают писать код, а способны брать на себя целые куски работы.

А вот генераторы писем, кажется, застряли на месте по сравнению с тем, что было год назад — или чат-боты, которым приходится жонглировать десятком разных задач, пишет TechCrunch.

Исследователи называют это «разрывом подкрепления» (reinforcement gap). Это разница между тем, чему ИИ может научиться быстро, и тем, где прогресс идёт медленно.

Причина проста, и она в том, что код легко проверять. Для моделей есть масса готовых тестов, которые позволяют мгновенно понять, работает программа или нет. Это идеальная среда для обучения через подкрепление — механизма, который сегодня двигает ИИ вперёд. Если система может получать понятную «оценку» (прошёл тест — не прошёл), её можно тренировать без остановки.

С текстами так не выйдет. Что считать «хорошим письмом» или «удачным ответом чат-бота» — часто вопрос вкуса. Здесь нет никакого автоматического теста, и модель учится медленнее. Поэтому навыки вроде отладки кода или математических расчётов растут семимильными шагами, а написание текстов или общение — миллиметровыми.

«Разрыв подкрепления» становится ключевым фактором, который определяет, какие ИИ-навыки будут развиваться быстрее. Разработка ПО для этого — почти идеальный полигон. Ещё до ИИ программисты жили тестами: юнит-тестами, интеграционными, нагрузочными — чтобы убедиться, что код не сломается при запуске. Теперь те же тесты — систематичные и масштабируемые — проверяют код, написанный ИИ.

А вот проверить «качество письма» или «удачную презентацию» невозможно без человека. Хотя и здесь не всё так однозначно, отмечает издание: компании, у которых есть ресурсы и фантазия, могут создать собственные тесты даже для сложных областей вроде финансовой аналитики и бухгалтерии.

Иногда тестируемыми оказываются даже те вещи, которые, казалось бы, не поддаются автоматизированной проверке — например, Sora 2 от OpenAI. Её ролики стали гораздо реалистичнее, улучшена физика, и это — результат того же обучения с подкреплением, только применённого к видео.

Если в будущем появятся новые подходы к обучению ИИ, «разрыв подкрепления» может исчезнуть. Но пока именно он определяет, какие профессии и задачи поддаются автоматизации, а какие — ещё держатся. Если процесс можно измерить и протестировать, его почти наверняка можно будет автоматизировать.

Разработчики теряют контроль над кодом созданным ИИ — мнение экспертов
Разработчики теряют контроль над кодом, созданным ИИ — мнение экспертов
По теме
Разработчики теряют контроль над кодом, созданным ИИ — мнение экспертов
Компании несут убытки от внедрения ИИ — прибыли пока не видно
Компании несут убытки от внедрения ИИ — прибыли пока не видно
По теме
Компании несут убытки от внедрения ИИ — прибыли пока не видно
Читайте также
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
Пока 20% топ-менеджеров утверждают, что машинное обучение является существенной частью их бизнеса, неудивительно, что стоимость мирового рынка машинного обучения, по некоторым оценкам, достигнет $117 млрд к концу 2027 года. Мы перевели материал Udacity о семи самых обсуждаемых тенденциях в машинном обучении в 2022 году.
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
4 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.