CS Bachelor: ∑(sleep) = 0, ∫(coffee)dx = ∞, stress² + bugs ≥ GPA ➡️ Bachelor of Computer Science
Support us

«Я застрял». Исследователи придумали, как помочь ИИ не теряться в мыслях

Исследователи из Nvidia, Google и Foundry представили открытый фреймворк Ember, который оптимизирует процесс обработки запросов большими языковыми моделями. Проблема таких систем в том, что они «застревают» в чрезмерном анализе, что снижает качество ответов. Новый метод решает эту проблему.

Оставить комментарий
«Я застрял». Исследователи придумали, как помочь ИИ не теряться в мыслях

Исследователи из Nvidia, Google и Foundry представили открытый фреймворк Ember, который оптимизирует процесс обработки запросов большими языковыми моделями. Проблема таких систем в том, что они «застревают» в чрезмерном анализе, что снижает качество ответов. Новый метод решает эту проблему.

Большие языковые модели обладают способностью к рассуждению и самопроверке. Однако, если процесс обдумывания затягивается, качество генерируемых ответов начинает ухудшаться. Джаред Куинси Дэвис, основатель и генеральный директор Foundry, сравнивает это с ситуацией, когда студент тратит слишком много времени на первый вопрос экзамена, зацикливаясь на нем.

Для решения этой проблемы Дэвис совместно с исследователями из Nvidia, Google, IBM, MIT, Stanford и DataBricks разработали фреймворк Ember. Он предполагает создание «сетей сетей», в которых один запрос может обрабатываться множеством моделей с различной продолжительностью анализа, в зависимости от оптимальных параметров для каждой модели и конкретного вопроса.

Идея Ember берет свое начало из более раннего подхода Дэвиса, который заключался в многократном обращении к ChatGPT 4 с одним и тем же вопросом и выборе лучшего ответа. Теперь этот метод масштабирован и формализован в виде структуры, которая позволяет создавать сложные системы, где задействованы различные модели.

Используя GPT 4, GPT 3, Anthropic, Gemini, DeepSeek с разными запросами и временем обдумывания, можно достичь лучшего результата ответа. Это означает переход от бинарной модели «вопрос-ответ» к многомерному процессу обработки информации, что особенно важно в контексте развития ИИ-агентов, способных выполнять задачи без вмешательства человека.

Хотя концепция «переосмысления» может показаться противоречащей идее масштабирования во время инференса (когда модели, тратящие больше времени на обдумывание, считались более перспективными), Дэвис отмечает, что оба подхода остаются важными, но будут использоваться разработчиками по-новому.

В будущем, по мнению Дэвиса, пользователи не будут напрямую выбирать модель (как в Perplexity или ChatGPT сейчас), а сложные системы сами будут маршрутизировать вопросы через оптимальные комбинации моделей. Количество вызовов различных моделей достигнет триллионов или квадриллионов, что потребует эффективных механизмов для их сортировки и выбора.

Meta помогает Китаю с ИИ? Бывшая сотрудница решила рассказать о секретах компании
Meta помогает Китаю с ИИ? Бывшая сотрудница решила рассказать о секретах компании
По теме
Meta помогает Китаю с ИИ? Бывшая сотрудница решила рассказать о секретах компании
Сделать ИИ-агентов «умными»? Кое-чему их научить ещё сложнее
Сделать ИИ-агентов «умными»? Кое-чему их научить ещё сложнее
По теме
Сделать ИИ-агентов «умными»? Кое-чему их научить ещё сложнее
Гейтс: через 10 лет будем работать 2 дня в неделю благодаря ИИ
Гейтс: через 10 лет будем работать 2 дня в неделю благодаря ИИ 
По теме
Гейтс: через 10 лет будем работать 2 дня в неделю благодаря ИИ
Как поддержать редакцию, если вы в Польше?

Помогите нам делать больше полезного контента

Читайте также
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Профессии будущего со скидкой 75% от Udacity: разработка роботов, дронов и робомобилей
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.