Mistral выпустил первую мультимодальную нейросеть

Французский стартап выпустил свою первую мультимодальную ИИ-модель Pixtral 12B, которая способна обрабатывать изображения и текст.

Оставить комментарий

Размер модели — около 24 ГБ, она имеет 12 миллиардов параметров. Например, у самой большой ИИ-модели Llama 3.1 405B разработки Meta сейчас 405 миллиардов параметров.

Подобно другим мультимодальным моделям, таким как семейство Claude от Anthropic и GPT-4o от OpenAI, Pixtral 12B может выполнять такие задачи, как подписи к изображениям и подсчет количества объектов на фотографии.

Pixtral 12B создали на основе одной из текстовых нейросетей Nemo 12B. Ее можно загрузить на GitHub и Hugging Face, также она станет доступна в чат-боте Mistral.

Ранее стартап представил Codestral — модель для генерации кода. Компания в 2023 году привлекла 385 миллионов евро инвестиций, в 2024 году — еще 600 миллионов. Среди акционеров стартапа числится Microsoft.

OpenAI готовит релиз «думающего» ИИ, который обгоняет человека
По теме
OpenAI готовит релиз «думающего» ИИ, который обгоняет человека
США, ЕС, Великобритания и другие страны подписали мировой договор об ИИ 
По теме
США, ЕС, Великобритания и другие страны подписали мировой договор об ИИ
Музыкант обманул стриминговые сервисы на $10 млн с помощью ИИ 
По теме
Музыкант обманул стриминговые сервисы на $10 млн с помощью ИИ

Читать на dev.by