Дапамажыце dev.by 🤍
Падтрымаць

Новая языковая модель DeepMind оказалась в 25 раз быстрее конкурентов

Компания выпустила свою языковую модель, которую называет самой эффективной, быстрой и прозрачной на рынке.

Пакінуць каментарый
Новая языковая модель DeepMind оказалась в 25 раз быстрее конкурентов

Компания выпустила свою языковую модель, которую называет самой эффективной, быстрой и прозрачной на рынке.

Ключевой особенностью модели является то, что она использует внешнюю память в форме обширной базе данных, которая содержит отрывки самых разных текстов. Авторы назвали модель RETRO (от Retrieval-Enhanced Transformer). По производительности модель не уступает нейросетям в 25 раз больше размера.

Языковые модели пишут тексты, предсказывая слово в предложении или фразе. Ранее ведущие ИИ-лаборатории Google, Facebook, Microsoft выпустили свои языковые модели после появления модели GPT-3 OpenAI. У GPT-3 свыше 175 миллиардов параметров, у модели Megatron (Microsoft) — 530 миллиардов.

Разработчики RETRO пошли по пути сокращения расходов на обучение языковой модели. У RETRO всего 7 миллиардов параметров, однако есть база на 2 триллиона фраз и предложений. Внешняя память позволяет добиться лучшего результата с меньшими затратами. Также RETRO способна справиться с проблемой предвзятости, дезинформации и «риторики ненависти».

Разработчик ИИ DeepMind впервые отчиталась о прибыли
Разработчик ИИ DeepMind впервые отчиталась о прибыли
По теме
Разработчик ИИ DeepMind впервые отчиталась о прибыли
DeepMind с помощью ИИ создаст коллекцию всех известных белков. Ученые получат доступ к архиву бесплатно
DeepMind с помощью ИИ создаст коллекцию всех известных белков. Ученые получат доступ к архиву бесплатно
По теме
DeepMind с помощью ИИ создаст коллекцию всех известных белков. Ученые получат доступ к архиву бесплатно
Чытайце таксама
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
У ЗША выйграна першая справа аб залежнасці ад сацсетак — Meta і Google пакараны за тое, як пабудаваны іх платформы
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Gemini навучыўся пераносіць дадзеныя з ChatGPT і Claude
Google запусціла ШІ-пошук Search Live па ўсім свеце, даступны на беларускай
Google запусціла ШІ-пошук Search Live па ўсім свеце, даступны на беларускай
Google запусціла ШІ-пошук Search Live па ўсім свеце, даступны на беларускай
Google прэзентавала Lyria 3 Pro: ШІ стварае 3-хвілінныя трэкі
Google прэзентавала Lyria 3 Pro: ШІ стварае 3-хвілінныя трэкі
Google прэзентавала Lyria 3 Pro: ШІ стварае 3-хвілінныя трэкі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.