🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

Microsoft обучила крупнейшую языковую модель на базе архитектуры Transformer

Подразделение Microsoft AI & Research представило, по его словам, крупнейшую в мире модель синтеза речи на основе нейронной архитектуры Transformer, сообщает VentureBeat.

Оставить комментарий

Подразделение Microsoft AI & Research представило, по его словам, крупнейшую в мире модель синтеза речи на основе нейронной архитектуры Transformer, сообщает VentureBeat.

Модель под названием Turing NLG содержит 17 млрд параметров — в два раза больше, чем Megatron от Nvidia, которая теперь стала второй по величине нейросетью с этой архитектурой, и в 10 раз больше, чем генератор новостей GPT-2.

Подобные модели умеют, например, сочинять рассказы, генерировать ответы в виде сложных предложений и резюмировать тексты. Как и в случае с чат-ботом Google Meena или алгоритмом OpenAI, доступ к Turing NLG «на пробу» пока предоставили только небольшому кругу внешних исследователей. 

Также разработчики Microsoft опубликовали библиотеку глубокого обучения DeepSpeed, которая упрощает распределенное обучение крупных нейросетей. Она поддерживает модели со 100 млрд или более параметров. Библиотека включает оптимизатор ZeRO для эффективного управления памятью при тренировке моделей и снижения расхода ресурсов. Оптимизатор использовался при обучении Turing NLG.

Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Microsoft хочет сделать из Copilot своего OpenClaw
Microsoft хочет сделать из Copilot своего OpenClaw
Microsoft хочет сделать из Copilot своего OpenClaw
Как избежать софт-апокалипсиса? Заставить ИИ платить за подписки
Как избежать софт-апокалипсиса? Заставить ИИ платить за подписки
Как избежать софт-апокалипсиса? Заставить ИИ платить за подписки
Anthropic раздает 13 бесплатных курсов по AI. Это не только введение в работу с Claude
Anthropic раздает 13 бесплатных курсов по AI. Это не только введение в работу с Claude
Anthropic раздает 13 бесплатных курсов по AI. Это не только введение в работу с Claude
Пока одни обсуждают, заменит ли AI разработчиков, другие уже во всю прокачиваются, причем делают это бесплатно. Компания Anthropic выложила сразу 13 курсов по работе с их моделью Claude. Это не маркетинговый лендинг с парой видео. Речь про полноценную обучающую линейку: от базового уровня до непростых технических тем вроде API и агентных систем.
1 комментарий
LinkedIn тайно узнаёт о вас больше, чем вы думаете — через расширения
LinkedIn тайно узнаёт о вас больше, чем вы думаете — через расширения
LinkedIn тайно узнаёт о вас больше, чем вы думаете — через расширения
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.