Дапамажыце dev.by 🤍
Падтрымаць

Meta выпусціла новае пакаленне ШІ-мадэляў Llama 4 з «мультыэкспертнай» архітэктурай

Meta запусціла новую сям’ю опенсорсных ШІ-мадэляў Llama 4. У яе ўвайшлі тры мультымадальныя мадэлі: Scout, Maverick і Behemoth, якія падтрымліваюць не толькі тэкставыя запыты, але таксама апрацоўваюць выявы, відэа і іншы кантэнт. Яны навучаліся на велізарным аб’ёме немаркіраваных тэкставых, графічных і відэаданых.

Пакінуць каментарый
Meta выпусціла новае пакаленне ШІ-мадэляў Llama 4 з «мультыэкспертнай» архітэктурай

Meta запусціла новую сям’ю опенсорсных ШІ-мадэляў Llama 4. У яе ўвайшлі тры мультымадальныя мадэлі: Scout, Maverick і Behemoth, якія падтрымліваюць не толькі тэкставыя запыты, але таксама апрацоўваюць выявы, відэа і іншы кантэнт. Яны навучаліся на велізарным аб’ёме немаркіраваных тэкставых, графічных і відэаданых.

Як адзначае TechCrunch, поспех мадэляў DeepSeek, якія не горшыя або нават лепшыя за папярэднія пакаленні флагманскіх мадэляў Llama, прымусіў Meta паскорыць распрацоўку ў гэтым напрамку. А яе супрацоўнікі з усіх сіл спрабуюць зразумець, як кітайскі стартап здолеў знізіць кошт распрацоўкі і запуску мадэляў R1 і V3.

Llama 4 Scout мае 109 млрд параметраў, у тым ліку 17 млрд актыўных і 16 «экспертных», а кантэкстнае акно складае 10 млн токенаў. Meta сцвярджае, што яна пераўзыходзіць Gemma 3, Gemini 2.0 Flash-Lite і Mistral 3.1 у апрацоўцы розных тыпаў задач.

Llama 4 Maverick мае 400 млрд параметраў, у тым ліку 17 млрд актыўных і 128 «экспертных». Кантэкстнае акно — 1 млн токенаў. Паводле распрацоўшчыкаў, мадэль пераўзыходзіць GPT-4o і Gemini 2.0 Flash у розных бенчмарках, а таксама параўнальная з DeepSeek V3 у разважаннях і напісанні кода.

Llama 4 Behemoth мае каля 2 трлн параметраў, у тым ліку 288 млрд актыўных і 16 «экспертных». Яна апярэджвае ў бенчмарках GPT-4.5, Claude Sonnet 3.7 і Gemini 2.0 Pro. Мадэль працягвае навучанне, таму пакуль публічна недаступная. Scout і Maverick даступныя на сайце llama.com і на Hugging Face.

Акрамя гэтага, на Llama 4 у 40 краінах свету пераключаны фірменны ШІ-памочнік Meta AI, інтэграваны ў WhatsApp, Messenger і Instagram. Але апрацоўка мультымадальных запытаў пакуль абмежаваная англійскай мовай і даступная толькі ў ЗША.

Llama 4 — першая лінейка ШІ-мадэляў з «мультыэкспертнай» архітэктурай (mixture-of-experts, MoE), якая больш эфектыўная пры навучанні і інферэнсе. Такая архітэктура дазваляе мадэлі разбіваць задачы на падзадачы, а затым дэлегаваць іх больш дробным і спецыялізаваным «экспертным» мадэлям. Пры гэтым ніводная з мадэляў Llama 4 не з’яўляецца «разважальнай», як GPT-o1 або GPT-o3-mini ад OpenAI, якія пераправяраюць свае адказы перад тым, як выдаць іх карыстальніку.

Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Па тэме
Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
Па тэме
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
OpenAI выпусціць мадэль з адкрытымі вагамі каб дагнаць DeepSeek і Meta
OpenAI выпусціць мадэль з адкрытымі вагамі, каб дагнаць DeepSeek і Meta
Па тэме
OpenAI выпусціць мадэль з адкрытымі вагамі, каб дагнаць DeepSeek і Meta
Чытайце таксама
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
CEO Airbnb: калі не браць зумераў, кіраваць хутка будзе няма каму
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
ШІ заўважыў, што яго «ўзламалі» падчас эксперыменту
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала "для сябе"
Meta абвінавацілі ў спампоўванні порна для ШІ. Кампанія заявіла, што спампоўвала "для сябе"
7 каментарыяў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў
Стваральнік ШІ-бота для тэхнічных сумоўяў назваў галоўную прычыну правалаў стартапаў

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.