Дапамажыце dev.by 🤍
Падтрымаць

IBM открыла датасет для обучения AI программированию

IBM представила датасет CodeNet, который исследователи могут использовать для создания интеллектуальных систем, способных транслировать код между языками программирования, анализировать и генерировать код, пишет ServerNews.

Пакінуць каментарый
IBM открыла датасет для обучения AI программированию

IBM представила датасет CodeNet, который исследователи могут использовать для создания интеллектуальных систем, способных транслировать код между языками программирования, анализировать и генерировать код, пишет ServerNews.

CodeNet представляет собой коллекцию из 14 млн образцов кода, решающих более 4 тысяч различных задач. Источником кода стали два японских конкурса по программированию — Aizu и AtCoder.

Суммарно набор насчитывает около 500 млн строк кода более чем на 55 языках — от современных, таких как C++, Java, Python и Go, до устаревших вроде COBOL, Pascal и FORTRAN. Более трёх четвертей массива приходится на С++ и Python. Помимо этого, код содержит метаданные и аннотации, уточняющие размер кода, расход памяти, процессорного времени, ошибки и другую информацию.

IBM рассчитывает, что проект поспособствует развитию AI-моделей, умеющих распознавать структуру программ, и станет своего рода аналогом базы ImageNet, которая считается стандартом в распознавании изображений и машинном зрении. Предполагается, что CodeNet будут использовать для создания интеллектуальных инструментов разработки для поиска нужных процедур в приложениях и библиотеках, перевода с одного языка программирования на другой, выбора правильных реализаций и отсева ошибочных, классификации кода и других задач.

Чытайце таксама
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
TinyML, No-code и обучение с подкреплением: новейшие тренды в машинном обучении
BBC: система распознавания лиц в Москве состоит из четырех алгоритмов. Они определяют эмоции
BBC: система распознавания лиц в Москве состоит из четырех алгоритмов. Они определяют эмоции
BBC: система распознавания лиц в Москве состоит из четырех алгоритмов. Они определяют эмоции
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 каментарыя
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта
Hyundai запустила институт искусственного интеллекта

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.