Мы запустили Dzik Pic Store. Заходи к нам в магазин за крутым мерчом ☃️
Support us

Microsoft обучила крупнейшую языковую модель на базе архитектуры Transformer

Подразделение Microsoft AI & Research представило, по его словам, крупнейшую в мире модель синтеза речи на основе нейронной архитектуры Transformer, сообщает VentureBeat.

Оставить комментарий

Подразделение Microsoft AI & Research представило, по его словам, крупнейшую в мире модель синтеза речи на основе нейронной архитектуры Transformer, сообщает VentureBeat.

Модель под названием Turing NLG содержит 17 млрд параметров — в два раза больше, чем Megatron от Nvidia, которая теперь стала второй по величине нейросетью с этой архитектурой, и в 10 раз больше, чем генератор новостей GPT-2.

Подобные модели умеют, например, сочинять рассказы, генерировать ответы в виде сложных предложений и резюмировать тексты. Как и в случае с чат-ботом Google Meena или алгоритмом OpenAI, доступ к Turing NLG «на пробу» пока предоставили только небольшому кругу внешних исследователей. 

Также разработчики Microsoft опубликовали библиотеку глубокого обучения DeepSpeed, которая упрощает распределенное обучение крупных нейросетей. Она поддерживает модели со 100 млрд или более параметров. Библиотека включает оптимизатор ZeRO для эффективного управления памятью при тренировке моделей и снижения расхода ресурсов. Оптимизатор использовался при обучении Turing NLG.

🎊 Dzik Pic Store открыт и готов принимать заказы!

Заходи к нам в магазин

Читайте также
Топ-40 профессий, наиболее уязвимых перед ИИ
Топ-40 профессий, наиболее уязвимых перед ИИ
Топ-40 профессий, наиболее уязвимых перед ИИ
1 комментарий
«Википедия» заставила ИИ-компании платить за использование данных
«Википедия» заставила ИИ-компании платить за использование данных
«Википедия» заставила ИИ-компании платить за использование данных
1 комментарий
«Треш ин — треш аут. Это закон всего». Как беларуска обучает студентов ИИ в Варшавском университете
«Треш ин — треш аут. Это закон всего». Как беларуска обучает студентов ИИ в Варшавском университете
«Треш ин — треш аут. Это закон всего». Как беларуска обучает студентов ИИ в Варшавском университете
Как учить искусственному интеллекту, когда он меняется буквально каждый день? Ключ — в критическом мышлении, считает Вольха Бандарэнка (Volha Bandarenka), беларуска, которая с помощью ИИ реставрировала киноклассику, создавала спецэффекты для Netflix, а сегодня преподает курсы по генеративному ИИ в польском вузе. Мы поговорили с Вольхой о студенческих проектах, будущем, и почему вузам не надо бояться искусственного интеллекта.
10 комментариев
Беларусь оказалась в топе стран по темпам внедрения DeepSeek — вместе с Ираном и Кубой
Беларусь оказалась в топе стран по темпам внедрения DeepSeek — вместе с Ираном и Кубой
Беларусь оказалась в топе стран по темпам внедрения DeepSeek — вместе с Ираном и Кубой
6 комментариев

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.