Автор вайб-кодинга: софт переживает переломный момент
Программное обеспечение снова меняется — на наших глазах происходят глубокие сдвиги в индустрии, спровоцированные ИИ. А потому сейчас невероятно интересное и уникальное время в мире технологий. Об этом в своём недавнем выступлении на конференции AI Startup School говорил сооснователь OpenAI, учёный в сфере машинного обучения и автор понятия «вайб-кодинг» Андрей Карпатый.
Программное обеспечение снова меняется — на наших глазах происходят глубокие сдвиги в индустрии, спровоцированные ИИ. А потому сейчас невероятно интересное и уникальное время в мире технологий. Об этом в своём недавнем выступлении на конференции AI Startup School говорил сооснователь OpenAI, учёный в сфере машинного обучения и автор понятия «вайб-кодинг» Андрей Карпатый.
Карпатый выделяет три ключевые парадигмы развития софта:
Software 1.0 — традиционный код, написанный человеком для компьютера (например, на C++). Это инструкции, создаваемые вручную, для выполнения задач в цифровой среде.
Software 2.0 — нейронные сети, в которых роль кода играют веса модели. Такие программы «пишутся» не строками кода, а с помощью данных и оптимизаторов (например, системы распознавания изображений). Платформы вроде Hugging Face становятся своего рода GitHub’ом для такого софта.
Software 3.0 — новейшая парадигма, основа которой — большие языковые модели (LLM). Здесь программы пишутся на естественном языке (например, на английском) и управляют поведением LLM, превращая её в «компьютер нового типа».
Карпатый приводит несколько наглядных аналогий, объясняющих природу языковых моделей:
Инфраструктура: LLM — как поставщики электричества: с тарификацией по использованию, с требованиями к высокой доступности и низкой задержке. Он отмечает, что когда топовые LLM перестают работать, это сопоставимо с «отключение интеллекта» (intelligence brownout) по всему миру.
Операционные системы: пожалуй, самая точная метафора. LLM — это сложные программные экосистемы, аналогичные Windows, macOS или Linux (где Llama, модель Meta, может стать опенсорсной альтернативой). LLM — это «эквивалент процессора», где окно контекста играет роль оперативной памяти. Сейчас мы, по его словам, находимся в «1960-х» — на этапе дорогих и централизованных вычислений, с моделью совместного использования ресурсов (time-sharing).
«Ду́хи человека»: LLM можно воспринимать как стохастические симуляции людей, с определённой формой человеческой психологии, возникшей из-за их обучения на огромных массивах текстов. У них есть сверхспособности (энциклопедические знания, идеальная память), но и «когнитивные дефекты»: галлюцинации, «рваный интеллект» (в чём-то они сверхлюди, в чём-то совершают глупые ошибки), и «энтроградная амнезия» — они не запоминают знания со временем, а зависят от прямого контекста.
Будущее разработки программ Карпатый видит в приложениях с частичной автономией и программирование с участием ИИ:
Человек и ИИ работают вместе — теперь человек не пишет код, а проверяет, что сгенерировал ИИ. Главное — ускорить цикл «генерация → верификация».
Специализированные GUI — визуальные интерфейсы помогают проверять работу ИИ гораздо быстрее, чем читать «сырые» текстовые выводы.
Ползунок автономии — продукты должны давать пользователю контроль: от простейших до полностью автономных действий ИИ в кодовой базе.
«ИИ на поводке» — это важно: формулировка промптов должна быть конкретной, чтобы минимизировать ошибки, а промежуточные артефакты (например, структура курса, созданная ИИ) — поддаваться аудиту. Это помогает удержать модель в рамках и повысить её эффективность.
Также Карпатый упомянул о «вайб-кодинге» — программировании с помощью ИИ через промпты на естественном языке. Теперь программистом может быть каждый, потому что естественный язык стал универсальным интерфейсом. Это по-настоящему беспрецедентное явление, которое может стать «входной точкой» в мир разработки для миллионов.
Но генерация кода — это лишь начало. Самое сложное — воплотить его в реальность: развёртывание, DevOps, аутентификация всё ещё остаются глубоко «человеческими» задачами.
Карпаты считает, что настало время учитывать особенности агентов-разработчиков. Например, в документации пора отходить от инструкций вроде человеческих «нажмите сюда» в сторону API-запросов, которые легко интерпретируются LLM. Что касается инструментов для скармливания данных ИИ, нужны утилиты, которые будут преобразовывать «человекоориентированный» цифровой контент (например, репозитории на GitHub) в формат, понятный языковым моделям.
Как говорит Карпаты, мы создаём «костюмы Железного человека» — продукты, которые расширяют возможности человека, но в то же время обладают автономными функциями. И этот «ползунок автономии» будет неумолимо сдвигаться в сторону большей самостоятельности ИИ в ближайшее десятилетие.
Сейчас — идеальное время, чтобы экспериментировать, изобретать и переписать будущее программного обеспечения, подводит черту исследователь.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
окрою "секрет" - язык программирования это логический язык
нет. человек пишет все тоже самое и еще больше на (английском) языке или еще каком-нибудь "сделай мне большую красную кнопку чтобы все было красиво"
это чушь - без модульного тестирования программа распадается от изменений со временем потому что неизвестно что "там" тестируется на самом деле
ну и самый цимес - для чего еще одна надстройка если все равно нужно вникать в потроха программ?
бла-бла-бла. дорого энергозатратно неэффективно, но в их карман