Мы запустили Dzik Pic Store. Заходи к нам в магазин за крутым мерчом ☃️
Support us

Российский «Сбер» представил русскоязычную версию модели для генерации текстов GPT-3

Оставить комментарий
Российский «Сбер» представил русскоязычную версию модели для генерации текстов GPT-3

«Сбер» выложил в открытый доступ русскоязычную версию алгоритма для генерации текстов GPT-3 Large с 760 млн параметров. Об этом сообщает N+1 со ссылкой на блог управляющего директора департамента SberDevices Сергея Маркова на «Хабре».

Для обучения модели был собран корпус текстов размером 600+ Гб. В него вошли произведения русской литературы, снапшоты русской и английской «Википедии», новостных и вопросно-ответных сайтов, публичные разделы Pikabu, публикации научно-популярного портала 22century.ru и банковского «Банки.ру», а также опенсорсного проекта Omnia Russica, содержащего 33 млрд слов русского языка. Чтобы научить GPT-3 обрабатывать программный код, в датасет включили данные GitHub и StackOverflow.

В проекте участвовали подразделения «Сбера» SberDevices, SberCloud и команда AI-разработчиков AGI NLP, которая провела работу по чистке и дедупликации данных, а также подготовила наборы для тестирования моделей.

При обучении оригинальной GPT-3 разработчики Open AI использовали 570 Гб текстов. И если в корпусе лаборатории присутствовали в основном материалы на английском языке — их соотношение к неанглоязычным составляло 93:7, то в датасете «Сбера» пропорция русского и других языков примерно 9:1.

OpenAI представила алгоритм для порождения текстов GPT-3 в мае 2020 года. Он умеет не только писать стихи, прозу и делать переводы, но также отвечать на вопросы по прочитанному материалу, решать арифметические примеры и программировать.

Бот на базе GPT-3 неделю выдавал себя за человека на Reddit
Бот на базе GPT-3 неделю выдавал себя за человека на Reddit
По теме
Бот на базе GPT-3 неделю выдавал себя за человека на Reddit
🎊 Dzik Pic Store открыт и готов принимать заказы!

Заходи к нам в магазин

Читайте также
ИИ ищет баги быстрее людей — эксперты говорят о точке перелома
ИИ ищет баги быстрее людей — эксперты говорят о точке перелома
ИИ ищет баги быстрее людей — эксперты говорят о точке перелома
Конца света не будет: «крестный отец» ИИ придумал, как спасти человечество
Конца света не будет: «крестный отец» ИИ придумал, как спасти человечество
Конца света не будет: «крестный отец» ИИ придумал, как спасти человечество
ИИ как личный коуч: может ли чат-бот помочь изменить жизнь
ИИ как личный коуч: может ли чат-бот помочь изменить жизнь
ИИ как личный коуч: может ли чат-бот помочь изменить жизнь
Мы не американцы — гендиректор Mistral назвал главное преимущество своего ИИ-стартапа
Мы не американцы — гендиректор Mistral назвал главное преимущество своего ИИ-стартапа
Мы не американцы — гендиректор Mistral назвал главное преимущество своего ИИ-стартапа

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.