Дапамажыце dev.by 🤍
Падтрымаць

Сузаснавальнік Databricks прапаноўвае $1 млн за рашэнне задач па кадзіраванні з выкарыстаннем АІ

Сузаснавальнік Databricks і Perplexity Эндзі Канвінскі абвясціў конкурс K Prize з галоўным прызам у памеры $1 мільёна для даследчыкаў, якія змогуць палепшыць здольнасць АІ у праграмаванні.

Пакінуць каментарый
Сузаснавальнік Databricks прапаноўвае $1 млн за рашэнне задач па кадзіраванні з выкарыстаннем АІ

Сузаснавальнік Databricks і Perplexity Эндзі Канвінскі абвясціў конкурс K Prize з галоўным прызам у памеры $1 мільёна для даследчыкаў, якія змогуць палепшыць здольнасць АІ у праграмаванні.

Канвінскі прапаноўвае ўзнагароджанне таму, хто зможа дамагчыся 90% дакладнасці на новым эталонным тэсце, які ацэньвае здольнасць АІ вырашаць задачы праграмавання. Конкурс арыентаваны на адкрытыя мадэлі, у адрозненне ад закрытых сістэм, распрацаваных кампаніямі накшталт OpenAI і Anthropic. Пакінуць заяўку на ўдзел можна тут.

Бізнэсмен падкрэсліў, што нават калі ніхто не дасягне 90% выніку, найлепшая заяўка атрымае не менш за $50 000. Канвінскі лічыць, што «мэта конкурсу — не столькі перамога, колькі стымуляванне інавацый і новых прарываў» у галіне АІ. Каб забяспечыць роўныя ўмовы для ўсіх удзельнікаў, Kaggle дасць вылічальныя рэсурсы распрацоўшчыкам, якія не маюць доступу да дастатковай магутнасці GPU.

Адной з галоўных праблем у галіне АІ-бэнчмаркетынгу з’яўляецца «забруджванне» навучальных даных, калі мадэлі навучаюцца на саміх тэстах, што скажае вынікі. У сувязі з гэтым Канвінскі супрацоўнічае з арганізацыямі SWE-bench і Kaggle для стварэння новага тэсту, які не будзе апублікаваны да моманту падачы мадэляў.

Такі падыход дазволіць дакладней ацаніць рэальныя магчымасці АІ у кадзіраванні. Існы тэст SWE-bench, які выкарыстоўвае рэальныя задачы з GitHub, выявіўся складаным для АІ, і найлепшыя мадэлі дасягаюць толькі 55% дакладнасці. Канвінскі лічыць, што развіццё кампактнейшых і эфектыўнейшых мадэляў АІ мае вялікае будучыню. Замест павелічэння маштабаў вылічэнняў конкурс стымулюе стварэнне больш інавацыйных падыходаў.

Рэжысёр даручыў ChatGPT напісаць сцэнар. Чат-бот падманваў маніпуляваў і сарваў тэрміны
Рэжысёр даручыў ChatGPT напісаць сцэнар. Чат-бот падманваў, маніпуляваў і сарваў тэрміны
Па тэме
Рэжысёр даручыў ChatGPT напісаць сцэнар. Чат-бот падманваў, маніпуляваў і сарваў тэрміны
GitHub Copilot стаў цалкам бясплатным унутры VSCode
GitHub Copilot стаў цалкам бясплатным унутры VSCode
Па тэме
GitHub Copilot стаў цалкам бясплатным унутры VSCode
OpenAI хоча адкупіцца ад некамерцыйнага падраздзялення каб стаць прыбытковым бізнэсам
OpenAI хоча адкупіцца ад некамерцыйнага падраздзялення, каб стаць прыбытковым бізнэсам
Па тэме
OpenAI хоча адкупіцца ад некамерцыйнага падраздзялення, каб стаць прыбытковым бізнэсам

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.