Патологоанатом, PM, косметолог. История одного выгорания🔥
Support us

В Германии разработали генератор текста, который превосходит GPT-3, но имеет в сотни раз меньше параметров

Двое исследователей искусственного интеллекта из Мюнхенского университета Людвига-Максимилиана (Ludwig Maximilian University, LMU) представили языковую модель, которая бьёт GPT-3 на языковых бенчмарках, но для её обучения использовалось в несколько сотен раз меньше параметров, чем для топового генератора текстов от OpenAI, сообщает The Next Web.

Оставить комментарий
В Германии разработали генератор текста, который превосходит GPT-3, но имеет в сотни раз меньше параметров

Двое исследователей искусственного интеллекта из Мюнхенского университета Людвига-Максимилиана (Ludwig Maximilian University, LMU) представили языковую модель, которая бьёт GPT-3 на языковых бенчмарках, но для её обучения использовалось в несколько сотен раз меньше параметров, чем для топового генератора текстов от OpenAI, сообщает The Next Web.

GPT-3 способна порождать относительно естественно звучащие тексты и даже неделями дурачить тысячи ничего не подозревающих читателей интернет-блогов.

GPT-3 имеет колоссальные 175 млрд параметров. Для сравнения, учёные из LMU обучили свою AI-систему всего на 223 млн параметров. При этом немецкая модель показывает лучшие результаты в тестах на бенчмарке superGLUE для задачи общего понимания языка. Считается, что чем больше параметров имеет модель, тем выше её способности.

Тем не менее утверждать, что новая система «лучше» GPT-3, нельзя — как и то, что она окажется мощнее на каких-либо других бенчмарках, кроме SuperGLUE, который не отражает все возможности разработки OpenAI, отмечает TNW.

Для создания системы использовался метод тренировки под названием «pattern-exploiting training» и предобученная нейросеть Albert. В OpenAI говорят, что хотя немецкая разработка не сможет превзойти GPT-3 на всех задачах, она откроет новые перспективы для разработки искусственного интеллекта на более скромном оборудовании.

Подробности опубликованы в научной работе на arXiv.org.

Читайте также
Акции технокомпаний по всему миру падали на фоне опасений об ИИ
Акции технокомпаний по всему миру падали на фоне опасений об ИИ
Акции технокомпаний по всему миру падали на фоне опасений об ИИ
В Claude Code заметили лазейку для доступа к заблокированной Fable 5
В Claude Code заметили лазейку для доступа к заблокированной Fable 5
В Claude Code заметили лазейку для доступа к заблокированной Fable 5
ИИ не заменяет людей: Ford возвращает уволенных, DeepSeek удваивает штат
ИИ не заменяет людей: Ford возвращает уволенных, DeepSeek удваивает штат
ИИ не заменяет людей: Ford возвращает уволенных, DeepSeek удваивает штат
Изнанка ИИ-программирования: как гонка нейросетей расколола айтишников
Изнанка ИИ-программирования: как гонка нейросетей расколола айтишников
Изнанка ИИ-программирования: как гонка нейросетей расколола айтишников

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.