Google назвала лепшы ШІ для распрацоўкі Android-аплікацый. Згадайцеся які
Кампанія прэзентавала новы рэйтынг ШІ-мадэляў, якія найлепш спраўляюцца з распрацоўкай Android-аплікацый. Для гэтага кампанія стварыла спецыяльны бэнчмарк Android Bench.
Кампанія прэзентавала новы рэйтынг ШІ-мадэляў, якія найлепш спраўляюцца з распрацоўкай Android-аплікацый. Для гэтага кампанія стварыла спецыяльны бэнчмарк Android Bench.
Кампанія прэзентавала новы рэйтынг ШІ-мадэляў, якія найлепш спраўляюцца з распрацоўкай Android-аплікацый. Для гэтага кампанія стварыла спецыяльны бэнчмарк Android Bench.
У Google адзначаюць, што існуючыя бэнчмаркі для праграмавання не ўлічваюць спецыфічныя задачы Android-распрацоўкі. Таму Android Bench правярае, як мадэлі працуюць з ключавымі тэхналогіямі платформы, уключаючы Jetpack Compose для інтэрфейсаў, Coroutines і Flows для асінхроннага праграмавання, Room для захоўвання дадзеных і Hilt для ўвядзення залежнасцей.
Таксама тэсты ацэньваюць здольнасць мадэляў спраўляцца з наладкай Gradle, міграцыямі навігацыі, зменамі SDK і працай з кампанентамі сістэмы, напрыклад камерай, медыя або інтэрфейсам сістэмы.

Па выніках тэставання найлепшай мадэллю для распрацоўкі Android-аплікацый стала Gemini 3.1 Pro Preview з вынікам 72,4%. На другім месцы апынулася Claude Opus 4.6 з вынікам 66,6%, а трэцяе месца заняла GPT-5.2 Codex ад OpenAI з паказчыкам 62,5%.
Бэнчмарк заснаваны на 100 задачах, узятых з рэальных pull-request у папулярных Android-рэпазітарыях на GitHub. Мадэлі павінны прапанаваць выпраўленні кода, пасля чаго сістэма аўтаматычна правярае, ці праходзяць змены тэсты і ці сапраўды вырашаюць праблему.



Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.