Mistral выпустил первую мультимодальную нейросеть
Французский стартап выпустил свою первую мультимодальную ИИ-модель Pixtral 12B, которая способна обрабатывать изображения и текст.
Французский стартап выпустил свою первую мультимодальную ИИ-модель Pixtral 12B, которая способна обрабатывать изображения и текст.
Размер модели — около 24 ГБ, она имеет 12 миллиардов параметров. Например, у самой большой ИИ-модели Llama 3.1 405B разработки Meta сейчас 405 миллиардов параметров.
Подобно другим мультимодальным моделям, таким как семейство Claude от Anthropic и GPT-4o от OpenAI, Pixtral 12B может выполнять такие задачи, как подписи к изображениям и подсчет количества объектов на фотографии.
We dropped a new model — Pixtral 12B, our first-ever multimodal model. Enjoy! 🥰🎉 https://t.co/uvXnpJf6mQ
— Sophia Yang, Ph.D. (@sophiamyang) September 11, 2024
Pixtral 12B создали на основе одной из текстовых нейросетей Nemo 12B. Ее можно загрузить на GitHub и Hugging Face, также она станет доступна в чат-боте Mistral.
Ранее стартап представил Codestral — модель для генерации кода. Компания в 2023 году привлекла 385 миллионов евро инвестиций, в 2024 году — еще 600 миллионов. Среди акционеров стартапа числится Microsoft.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.