АІ трэніруе робасабаку нашмат хутчэй і эфектыўней за чалавека
Навукоўцы Пенсільванскага ўніверсітэта распрацавалі сістэму, прызначаную для навучання робатаў з выкарыстаннем штучнага інтэлекту.
Навукоўцы Пенсільванскага ўніверсітэта распрацавалі сістэму, прызначаную для навучання робатаў з выкарыстаннем штучнага інтэлекту.
Навукоўцы Пенсільванскага ўніверсітэта распрацавалі сістэму, прызначаную для навучання робатаў з выкарыстаннем штучнага інтэлекту.
Сістэма DrEureka (Domain Randomization Eureka) узаемадзейнічала з робатам Unitree Go1. Гэта чатырохногая машына з адкрытым зыходным кодам. Навучанне робата праходзіла ў сімуляваным асяроддзі, для гэтага ўжывалася рандамізацыя асноўных зменных: гэта паказчыкі трэння, масы, зрушэння цэнтра цяжару і іншыя параметры.
АІ на аснове некалькіх карыстальніцкіх запытаў генераваў код, які апісваў сістэму ўзнагароджанняў і штрафаў для навучання робата ў віртуальным асяроддзі. AI затым аналізаваў кожнае мадэляванне, наколькі добра віртуальны робат даў рады задачы і як вынік можна палепшыць.
Аўтары заўважылі, што для карэктнага напісання кода АІ неабходна ўводзіць дадатковыя інструкцыі па бяспецы. У адваротным выпадку нейрасетка пачынае жульнічаць пры мадэляванні, імкнучыся да максімальнай прадукцыйнасці. У рэальным свеце гэта магло б прывесці да перагрэву рухавікоў і пашкоджання робата.
У выніку эксперыменту DrEureka дала рады задачы навучання робата лепш за чалавека. Сістэма паказала рост хуткасці руху робата на 34% і павелічэнне адлегласці, пераадольванай па перасечанай мясцовасці, на 20%. Навукоўцы лічаць, што розніца палягае ў падыходах да навучання: чалавек разбівае яго на некалькі этапаў і знаходзіць рашэнне па кожным, тады як нейрасетка навучае ўсім адразу.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.