Дапамажыце dev.by 🤍
Падтрымаць

Meta выпусціла новае пакаленне ШІ-мадэляў Llama 4 з «мультыэкспертнай» архітэктурай

Meta запусціла новую сям’ю опенсорсных ШІ-мадэляў Llama 4. У яе ўвайшлі тры мультымадальныя мадэлі: Scout, Maverick і Behemoth, якія падтрымліваюць не толькі тэкставыя запыты, але таксама апрацоўваюць выявы, відэа і іншы кантэнт. Яны навучаліся на велізарным аб’ёме немаркіраваных тэкставых, графічных і відэаданых.

Пакінуць каментарый
Meta выпусціла новае пакаленне ШІ-мадэляў Llama 4 з «мультыэкспертнай» архітэктурай

Meta запусціла новую сям’ю опенсорсных ШІ-мадэляў Llama 4. У яе ўвайшлі тры мультымадальныя мадэлі: Scout, Maverick і Behemoth, якія падтрымліваюць не толькі тэкставыя запыты, але таксама апрацоўваюць выявы, відэа і іншы кантэнт. Яны навучаліся на велізарным аб’ёме немаркіраваных тэкставых, графічных і відэаданых.

Як адзначае TechCrunch, поспех мадэляў DeepSeek, якія не горшыя або нават лепшыя за папярэднія пакаленні флагманскіх мадэляў Llama, прымусіў Meta паскорыць распрацоўку ў гэтым напрамку. А яе супрацоўнікі з усіх сіл спрабуюць зразумець, як кітайскі стартап здолеў знізіць кошт распрацоўкі і запуску мадэляў R1 і V3.

Llama 4 Scout мае 109 млрд параметраў, у тым ліку 17 млрд актыўных і 16 «экспертных», а кантэкстнае акно складае 10 млн токенаў. Meta сцвярджае, што яна пераўзыходзіць Gemma 3, Gemini 2.0 Flash-Lite і Mistral 3.1 у апрацоўцы розных тыпаў задач.

Llama 4 Maverick мае 400 млрд параметраў, у тым ліку 17 млрд актыўных і 128 «экспертных». Кантэкстнае акно — 1 млн токенаў. Паводле распрацоўшчыкаў, мадэль пераўзыходзіць GPT-4o і Gemini 2.0 Flash у розных бенчмарках, а таксама параўнальная з DeepSeek V3 у разважаннях і напісанні кода.

Llama 4 Behemoth мае каля 2 трлн параметраў, у тым ліку 288 млрд актыўных і 16 «экспертных». Яна апярэджвае ў бенчмарках GPT-4.5, Claude Sonnet 3.7 і Gemini 2.0 Pro. Мадэль працягвае навучанне, таму пакуль публічна недаступная. Scout і Maverick даступныя на сайце llama.com і на Hugging Face.

Акрамя гэтага, на Llama 4 у 40 краінах свету пераключаны фірменны ШІ-памочнік Meta AI, інтэграваны ў WhatsApp, Messenger і Instagram. Але апрацоўка мультымадальных запытаў пакуль абмежаваная англійскай мовай і даступная толькі ў ЗША.

Llama 4 — першая лінейка ШІ-мадэляў з «мультыэкспертнай» архітэктурай (mixture-of-experts, MoE), якая больш эфектыўная пры навучанні і інферэнсе. Такая архітэктура дазваляе мадэлі разбіваць задачы на падзадачы, а затым дэлегаваць іх больш дробным і спецыялізаваным «экспертным» мадэлям. Пры гэтым ніводная з мадэляў Llama 4 не з’яўляецца «разважальнай», як GPT-o1 або GPT-o3-mini ад OpenAI, якія пераправяраюць свае адказы перад тым, як выдаць іх карыстальніку.

Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Па тэме
Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
Па тэме
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
OpenAI выпусціць мадэль з адкрытымі вагамі каб дагнаць DeepSeek і Meta
OpenAI выпусціць мадэль з адкрытымі вагамі, каб дагнаць DeepSeek і Meta
Па тэме
OpenAI выпусціць мадэль з адкрытымі вагамі, каб дагнаць DeepSeek і Meta
Чытайце таксама
Горшая ў Еўропе: Беларусь засвяцілася ў сусветным рэйтынгу ШІ
Горшая ў Еўропе: Беларусь засвяцілася ў сусветным рэйтынгу ШІ
Горшая ў Еўропе: Беларусь засвяцілася ў сусветным рэйтынгу ШІ
7 каментарыяў
OpenAI можа забраць да 40% сусветнай памяці — рынак рыхтуецца да дэфіцыту
OpenAI можа забраць да 40% сусветнай памяці — рынак рыхтуецца да дэфіцыту
OpenAI можа забраць да 40% сусветнай памяці — рынак рыхтуецца да дэфіцыту
1 каментарый
Тэхкампаніі дзеля ШІ трапілі ў рэкордныя даўгі за ўсю гісторыю галіны
Тэхкампаніі дзеля ШІ трапілі ў рэкордныя даўгі за ўсю гісторыю галіны
Тэхкампаніі дзеля ШІ трапілі ў рэкордныя даўгі за ўсю гісторыю галіны
1 каментарый
Галоўны ШІ-навуковец Meta назваў агульны ШІ «лухтой». У Google не пагадзіліся
Галоўны ШІ-навуковец Meta назваў агульны ШІ «лухтой». У Google не пагадзіліся
Галоўны ШІ-навуковец Meta назваў агульны ШІ «лухтой». У Google не пагадзіліся

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.