Дапамажыце dev.by 🤍
Падтрымаць

Microsoft обучила крупнейшую языковую модель на базе архитектуры Transformer

Подразделение Microsoft AI & Research представило, по его словам, крупнейшую в мире модель синтеза речи на основе нейронной архитектуры Transformer, сообщает VentureBeat.

Пакінуць каментарый

Подразделение Microsoft AI & Research представило, по его словам, крупнейшую в мире модель синтеза речи на основе нейронной архитектуры Transformer, сообщает VentureBeat.

Модель под названием Turing NLG содержит 17 млрд параметров — в два раза больше, чем Megatron от Nvidia, которая теперь стала второй по величине нейросетью с этой архитектурой, и в 10 раз больше, чем генератор новостей GPT-2.

Подобные модели умеют, например, сочинять рассказы, генерировать ответы в виде сложных предложений и резюмировать тексты. Как и в случае с чат-ботом Google Meena или алгоритмом OpenAI, доступ к Turing NLG «на пробу» пока предоставили только небольшому кругу внешних исследователей. 

Также разработчики Microsoft опубликовали библиотеку глубокого обучения DeepSpeed, которая упрощает распределенное обучение крупных нейросетей. Она поддерживает модели со 100 млрд или более параметров. Библиотека включает оптимизатор ZeRO для эффективного управления памятью при тренировке моделей и снижения расхода ресурсов. Оптимизатор использовался при обучении Turing NLG.

Чытайце таксама
Топ-40 прафесій, якія найбольш уразлівыя перад ШІ
Топ-40 прафесій, якія найбольш уразлівыя перад ШІ
Топ-40 прафесій, якія найбольш уразлівыя перад ШІ
1 каментарый
«Вікіпедыя» прымусіла ШІ-кампаніі плаціць за выкарыстанне дадзеных
«Вікіпедыя» прымусіла ШІ-кампаніі плаціць за выкарыстанне дадзеных
«Вікіпедыя» прымусіла ШІ-кампаніі плаціць за выкарыстанне дадзеных
1 каментарый
«Трэш ін — трэш аўт. Гэта закон усяго». Як беларуска навучае студэнтаў ШІ ў Варшаўскім універсітэце
«Трэш ін — трэш аўт. Гэта закон усяго». Як беларуска навучае студэнтаў ШІ ў Варшаўскім універсітэце
«Трэш ін — трэш аўт. Гэта закон усяго». Як беларуска навучае студэнтаў ШІ ў Варшаўскім універсітэце
Як навучаць штучнаму інтэлекту, калі ён змяняецца літаральна кожны дзень? Ключ — у крытычным мысленні, лічыць Вольха Бандарэнка, беларуска, якая з дапамогай ШІ алічбоўвала кінакласіку, стварала спецэфекты для Netflix, а сёння выкладае курсы па ШІ ў польскай ВНУ. Мы пагутарылі з Вольхай пра студэнцкія праекты, будучыню і чаму ўніверсітэтам не трэба баяцца штучнага інтэлекту.
10 каментарыяў
Беларусь апынулася ў топе краін па тэмпах укаранення DeepSeek — разам з Іранам і Кубай
Беларусь апынулася ў топе краін па тэмпах укаранення DeepSeek — разам з Іранам і Кубай
Беларусь апынулася ў топе краін па тэмпах укаранення DeepSeek — разам з Іранам і Кубай
6 каментарыяў

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.