Дапамажыце dev.by 🤍
Падтрымаць

ШІ часта «захрасае» ў сваіх думках. Даследчыкі вырашылі гэтую праблему

Даследчыкі з Nvidia, Google і Foundry прэзентавалі адкрыты фрэймворк Ember, які аптымізуе працэс апрацоўкі запытаў вялікімі моўнымі мадэлямі. Праблема такіх сістэм у тым, што яны «захрасаюць» ў празмерным аналізе, што пагаршае якасць адказаў. Новы метад вырашае гэтую праблему.

Пакінуць каментарый
ШІ часта «захрасае» ў сваіх думках. Даследчыкі вырашылі гэтую праблему

Даследчыкі з Nvidia, Google і Foundry прэзентавалі адкрыты фрэймворк Ember, які аптымізуе працэс апрацоўкі запытаў вялікімі моўнымі мадэлямі. Праблема такіх сістэм у тым, што яны «захрасаюць» ў празмерным аналізе, што пагаршае якасць адказаў. Новы метад вырашае гэтую праблему.

Вялікія моўныя мадэлі маюць здольнасць да разважанняў і самаправеркі. Аднак, калі працэс абдумвання зацягваецца, якасць адказаў пачынае пагаршацца. Джарэд Куінсі Дэвіс, заснавальнік і генеральны дырэктар Foundry, параўноўвае гэта з сітуацыяй, калі студэнт марнуе занадта шмат часу на першае пытанне іспыту, захраснуўшы на ім.

Для вырашэння гэтай праблемы Дэвіс сумесна з даследчыкамі з Nvidia, Google, IBM, MIT, Stanford і DataBricks распрацавалі фрэймворк Ember. Ён прадугледжвае стварэнне «сетак сетак», дзе адзін запыт можа апрацоўвацца мноствам мадэляў з рознай працягласцю аналізу, у залежнасці ад аптымальных параметраў для кожнай мадэлі і канкрэтнага пытання.

Ідэя Ember паходзіць з больш ранняга падыходу Дэвіса, які заключаўся ў шматразовым звароце да ChatGPT 4 з адным і тым жа пытаннем і выбары лепшага адказу. Цяпер гэты метад маштабуецца і фармалізуецца ў выглядзе структуры, якая дазваляе ствараць складаныя сістэмы, дзе задзейнічаны розныя мадэлі.

Выкарыстоўваючы GPT 4, GPT 3, Anthropic, Gemini, DeepSeek з рознымі запытамі і часам абмеркавання, можна дасягнуць лепшага выніку адказу. Гэта азначае пераход ад бінарнай мадэлі «пытанне-адказ» да шматмернага працэсу апрацоўкі інфармацыі, што асабліва важна ў кантэксце развіцця ШІ-агентаў, здольных выконваць задачы без умяшання чалавека.

Хоць канцэпцыя «пераасэнсавання» можа падацца супярэчнай ідэі маштабавання падчас інферэнсу (калі мадэлі, якія трацяць больш часу на абмеркаванне, лічыліся больш перспектыўнымі), Дэвіс адзначае, што абодва падыходы застаюцца важнымі, але будуць выкарыстоўвацца распрацоўшчыкамі па-новаму.

У будучыні, па меркаванні Дэвіса, карыстальнікі не будуць непасрэдна выбіраць мадэль (як у Perplexity або ChatGPT зараз), а складаныя сістэмы самі будуць маршрутызаваць пытанні праз аптымальныя камбінацыі мадэляў. Колькасць выклікаў розных мадэляў дасягне трыльёнаў або квадрыльёнаў, што патрабуе эфектыўных механізмаў для іх сартавання і выбару.

Meta дапамагае Кітаю з ШІ? Былая супрацоўніца вырашыла расказаць пра сакрэты кампаніі
Meta дапамагае Кітаю з ШІ? Былая супрацоўніца вырашыла расказаць пра сакрэты кампаніі
Па тэме
Meta дапамагае Кітаю з ШІ? Былая супрацоўніца вырашыла расказаць пра сакрэты кампаніі
Зрабіць ШІ-агентаў «разумнымі»? Некаторым рэчам навучыць іх яшчэ складаней
Зрабіць ШІ-агентаў «разумнымі»? Некаторым рэчам навучыць іх яшчэ складаней
Па тэме
Зрабіць ШІ-агентаў «разумнымі»? Некаторым рэчам навучыць іх яшчэ складаней
Гейтс: праз 10 гадоў будзем працаваць 2 дні на тыдзень дзякуючы ШІ
Гейтс: праз 10 гадоў будзем працаваць 2 дні на тыдзень дзякуючы ШІ
Па тэме
Гейтс: праз 10 гадоў будзем працаваць 2 дні на тыдзень дзякуючы ШІ
Чытайце таксама
10+ сертификаций Coursera, которые помогут улучшить резюме и повысить зарплату
10+ сертификаций Coursera, которые помогут улучшить резюме и повысить зарплату
10+ сертификаций Coursera, которые помогут улучшить резюме и повысить зарплату
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Разработка роботов, дронов и робомобилей: где учат специалистов с зарплатой $100k+
Искусственный интеллект уже стал повседневностью: голосовой помощник включает музыку, робот-пылесос сканирует пространство и убирает квартиру, алгоритм ранжирования настраивает ленту в TikTok, а беспилотные такси уже свободно курсируют по городам. Получить профессию в сфере ИИ с зарплатой от $100k в год тоже стало проще — собрали 5 интересных курсов от Udacity. 
Приложение Трампа Truth Social заблокировано в Google Play
Приложение Трампа Truth Social заблокировано в Google Play
Приложение Трампа Truth Social заблокировано в Google Play

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.