«Яндекс» выложил YaLM 100B — крупнейшую нейросеть для порождения текста в открытом доступе
«Яндекс» выложил в открытый доступ нейросеть YaLM 100B для генерации и обработки текстов на русском и английском языках. Компания говорит, что это самая большая GPT-подобная модель, находящаяся в свободном доступе для разработчиков и исследователей со всего мира. YaLM 100В содержит 100 млрд параметров и по этому показателю превосходит все существующие модели для русского языка.
Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Они способны генерировать любые тексты (стихи, ответы, поздравления и прочие), придумывать идеи для рекламных кампаний, создавать описания товаров и видео, а также классифицировать их, например, по стилю речи.
Внутри «Яндекса» нейросети YaLM задействованы более чем в 20 проектах, в том числе в поисковике и голосовом помощнике «Алиса». Языковые модели генерируют ответы на обращения в службе поддержки, рекламные объявления, краткие описания сайтов и быстрые ответы в «Поиске».
YaLM 100B обучали на суперкомпьютерах «Яндекса», признанных самыми мощными в Восточной Европе, на базе примерно 2 Тб текстов из открытых датасетов и интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.