Николай Чикишев 19 снежня 2024, 15:00

Сузаснавальнік Databricks прапаноўвае $1 млн за рашэнне задач па кадзіраванні з выкарыстаннем АІ

Сузаснавальнік Databricks і Perplexity Эндзі Канвінскі абвясціў конкурс K Prize з галоўным прызам у памеры $1 мільёна для даследчыкаў, якія змогуць палепшыць здольнасць АІ у праграмаванні.

Пакінуць каментарый

Сузаснавальнік Databricks прапаноўвае $1 млн за рашэнне задач па кадзіраванні з выкарыстаннем АІ

Сузаснавальнік Databricks і Perplexity Эндзі Канвінскі абвясціў конкурс K Prize з галоўным прызам у памеры $1 мільёна для даследчыкаў, якія змогуць палепшыць здольнасць АІ у праграмаванні.

Канвінскі прапаноўвае ўзнагароджанне таму, хто зможа дамагчыся 90% дакладнасці на новым эталонным тэсце, які ацэньвае здольнасць АІ вырашаць задачы праграмавання. Конкурс арыентаваны на адкрытыя мадэлі, у адрозненне ад закрытых сістэм, распрацаваных кампаніямі накшталт OpenAI і Anthropic. Пакінуць заяўку на ўдзел можна тут.

Бізнэсмен падкрэсліў, што нават калі ніхто не дасягне 90% выніку, найлепшая заяўка атрымае не менш за $50 000. Канвінскі лічыць, што «мэта конкурсу — не столькі перамога, колькі стымуляванне інавацый і новых прарываў» у галіне АІ. Каб забяспечыць роўныя ўмовы для ўсіх удзельнікаў, Kaggle дасць вылічальныя рэсурсы распрацоўшчыкам, якія не маюць доступу да дастатковай магутнасці GPU.

Адной з галоўных праблем у галіне АІ-бэнчмаркетынгу з’яўляецца «забруджванне» навучальных даных, калі мадэлі навучаюцца на саміх тэстах, што скажае вынікі. У сувязі з гэтым Канвінскі супрацоўнічае з арганізацыямі SWE-bench і Kaggle для стварэння новага тэсту, які не будзе апублікаваны да моманту падачы мадэляў.

Такі падыход дазволіць дакладней ацаніць рэальныя магчымасці АІ у кадзіраванні. Існы тэст SWE-bench, які выкарыстоўвае рэальныя задачы з GitHub, выявіўся складаным для АІ, і найлепшыя мадэлі дасягаюць толькі 55% дакладнасці. Канвінскі лічыць, што развіццё кампактнейшых і эфектыўнейшых мадэляў АІ мае вялікае будучыню. Замест павелічэння маштабаў вылічэнняў конкурс стымулюе стварэнне больш інавацыйных падыходаў.