Meta выпустила самую большую и мощную опенсорсную ИИ-модель в мире

Meta представила крупнейшую в мире открытую ИИ-модель Llama 3.1. Компания заявляет, что по производительности она превосходит частные модели OpenAI и других конкурентов, включая GPT-4o и Claude 3.5 Sonnet от Anthropic, на некоторых бенчмарках. Она вышла вперёд по общим знаниям, математике и языковому переводу.

3 комментария

Помимо этого, компания расширила список стран и языков, поддерживаемых её ИИ-ассистентом, и добавила функцию генерации картинок. Марк Цукерберг считает, что к концу года Meta AI обгонит ChatGPT по популярности.

Llama 3.1 значительно сложнее моделей Llama 3, которые были выпущены несколько месяцев назад. Старшая версия насчитывает 405 млрд параметров, а для её обучения было задействовано 16 тысяч дорогущих GPU H100 от Nvidia. Затраты на разработку Llama 3.1 компания держит в секрете, но даже если исходить только из стоимости чипов Nvidia, сумма может достигать сотен миллионов долларов.

Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире
По теме
Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире

Цукерберг добавил, что опенсорсные ИИ-модели уже развиваются быстрее проприетарных и в дальнейшем превзойдут их, а также провёл параллель с Linux. «Я убеждён, что релиз Llama 3.1 станет переломным моментом для отрасли, после которого большинство разработчиков начнут преимущественно пользоваться опенсорсом», — написал предприниматель.

Meta сотрудничает примерно с тремя десятками компаний, включая Microsoft, Amazon, Google, Nvidia и Databricks, чтобы помочь разработчикам развёртывать свои версии модели. В Meta говорят, что эксплуатация Llama 3.1 обходится примерно вдвое дешевле по сравнению с GPT-4o. Также она выложила веса модели, чтобы сторонние разработчики могли тренировать её на своих данных и кастомизировать по своему усмотрению. Информацию о данных, на которых обучалась Llama 3.1, Meta не раскрывает — кроме того, что использовала синтетические данные, то есть сгенерированные моделью, а не человеком, для улучшения младших Llama 3.1 на 70 млрд и 8 млрд параметров посредством старшей версии.

Meta выпустила Llama 3 — лучшую среди открытых моделей
По теме
Meta выпустила Llama 3 — лучшую среди открытых моделей
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
По теме
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini

Читать на dev.by