🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

IBM открыла датасет для обучения AI программированию

IBM представила датасет CodeNet, который исследователи могут использовать для создания интеллектуальных систем, способных транслировать код между языками программирования, анализировать и генерировать код, пишет ServerNews.

Оставить комментарий
IBM открыла датасет для обучения AI программированию

IBM представила датасет CodeNet, который исследователи могут использовать для создания интеллектуальных систем, способных транслировать код между языками программирования, анализировать и генерировать код, пишет ServerNews.

CodeNet представляет собой коллекцию из 14 млн образцов кода, решающих более 4 тысяч различных задач. Источником кода стали два японских конкурса по программированию — Aizu и AtCoder.

Суммарно набор насчитывает около 500 млн строк кода более чем на 55 языках — от современных, таких как C++, Java, Python и Go, до устаревших вроде COBOL, Pascal и FORTRAN. Более трёх четвертей массива приходится на С++ и Python. Помимо этого, код содержит метаданные и аннотации, уточняющие размер кода, расход памяти, процессорного времени, ошибки и другую информацию.

IBM рассчитывает, что проект поспособствует развитию AI-моделей, умеющих распознавать структуру программ, и станет своего рода аналогом базы ImageNet, которая считается стандартом в распознавании изображений и машинном зрении. Предполагается, что CodeNet будут использовать для создания интеллектуальных инструментов разработки для поиска нужных процедур в приложениях и библиотеках, перевода с одного языка программирования на другой, выбора правильных реализаций и отсева ошибочных, классификации кода и других задач.

Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Нажми на утку: GitHub Copilot добавил «второе мнение» от ИИ — код стал точнее
Нажми на утку: GitHub Copilot добавил «второе мнение» от ИИ — код стал точнее
Нажми на утку: GitHub Copilot добавил «второе мнение» от ИИ — код стал точнее
«Что это, чёрт возьми, такое?»: в Кремниевой долине спорят о главной метрике ИИ-стартапов
«Что это, чёрт возьми, такое?»: в Кремниевой долине спорят о главной метрике ИИ-стартапов
«Что это, чёрт возьми, такое?»: в Кремниевой долине спорят о главной метрике ИИ-стартапов
В Meta запустили рейтинг по расходу токенов — сотрудники начали читерить
В Meta запустили рейтинг по расходу токенов — сотрудники начали читерить
В Meta запустили рейтинг по расходу токенов — сотрудники начали читерить
В сети завирусился «кнут для ИИ», который заставляет агентов ускоряться
В сети завирусился «кнут для ИИ», который заставляет агентов ускоряться
В сети завирусился «кнут для ИИ», который заставляет агентов ускоряться

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.