Support us

IBM открыла датасет для обучения AI программированию

IBM представила датасет CodeNet, который исследователи могут использовать для создания интеллектуальных систем, способных транслировать код между языками программирования, анализировать и генерировать код, пишет ServerNews.

Оставить комментарий
IBM открыла датасет для обучения AI программированию

IBM представила датасет CodeNet, который исследователи могут использовать для создания интеллектуальных систем, способных транслировать код между языками программирования, анализировать и генерировать код, пишет ServerNews.

CodeNet представляет собой коллекцию из 14 млн образцов кода, решающих более 4 тысяч различных задач. Источником кода стали два японских конкурса по программированию — Aizu и AtCoder.

Суммарно набор насчитывает около 500 млн строк кода более чем на 55 языках — от современных, таких как C++, Java, Python и Go, до устаревших вроде COBOL, Pascal и FORTRAN. Более трёх четвертей массива приходится на С++ и Python. Помимо этого, код содержит метаданные и аннотации, уточняющие размер кода, расход памяти, процессорного времени, ошибки и другую информацию.

IBM рассчитывает, что проект поспособствует развитию AI-моделей, умеющих распознавать структуру программ, и станет своего рода аналогом базы ImageNet, которая считается стандартом в распознавании изображений и машинном зрении. Предполагается, что CodeNet будут использовать для создания интеллектуальных инструментов разработки для поиска нужных процедур в приложениях и библиотеках, перевода с одного языка программирования на другой, выбора правильных реализаций и отсева ошибочных, классификации кода и других задач.

Читайте также
В Польше построят первый национальный ИИ-хаб. Поучаствует ElevenLabs
В Польше построят первый национальный ИИ-хаб. Поучаствует ElevenLabs
В Польше построят первый национальный ИИ-хаб. Поучаствует ElevenLabs
Упоминание «ИИ» в рекламе отталкивает больше потребителей, чем привлекает — исследование
Упоминание «ИИ» в рекламе отталкивает больше потребителей, чем привлекает — исследование
Упоминание «ИИ» в рекламе отталкивает больше потребителей, чем привлекает — исследование
Компании перекраивают наём, бюджеты и использование ИИ-токенов — они слишком дорогие
Компании перекраивают наём, бюджеты и использование ИИ-токенов — они слишком дорогие
Компании перекраивают наём, бюджеты и использование ИИ-токенов — они слишком дорогие
Новый фреймворк снижает расходы на работу ИИ-агентов на 50%
Новый фреймворк снижает расходы на работу ИИ-агентов на 50%
Новый фреймворк снижает расходы на работу ИИ-агентов на 50%

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.