Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире

Французский стартап Mistral AI и Nvidia представили новую языковую модель Mistral NeMo 12B, которую легко кастомизировать для решения различных корпоративных задач — например, для чат-ботов, обработки данных, программирования и прочего.

Оставить комментарий

Модель насчитывает 12 млрд параметров и обладает контекстным окном в 12 тысяч токенов. Разработчики утверждают, что она отличается точностью, гибкостью, высокой эффективностью, а также качественной поддержкой и безопасностью.

Применение формата данных FP8 для инференса позволило уменьшить размер требуемой памяти и ускорить развёртывание модели без ущерба для точности ответов. Mistral NeMo выпущена под лицензией Apache 2.0. Разработчики уверяют, что на её внедрение потребуются не дни, а минуты.

По их словам, модель отлично справляется с длинными диалогами, математическими задачами и программированием, способна рассуждать на основе здравого смысла и обладает знаниями о мире. Благодаря этому она может иметь очень широкий круг применения.

OpenAI выпустила упрощённую версию флагманской ИИ-модели
По теме
OpenAI выпустила упрощённую версию флагманской ИИ-модели
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
По теме
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini

Читать на dev.by