Дапамажыце dev.by 🤍
Падтрымаць

Meta выпусціла новае пакаленне ШІ-мадэляў Llama 4 з «мультыэкспертнай» архітэктурай

Meta запусціла новую сям’ю опенсорсных ШІ-мадэляў Llama 4. У яе ўвайшлі тры мультымадальныя мадэлі: Scout, Maverick і Behemoth, якія падтрымліваюць не толькі тэкставыя запыты, але таксама апрацоўваюць выявы, відэа і іншы кантэнт. Яны навучаліся на велізарным аб’ёме немаркіраваных тэкставых, графічных і відэаданых.

Пакінуць каментарый
Meta выпусціла новае пакаленне ШІ-мадэляў Llama 4 з «мультыэкспертнай» архітэктурай

Meta запусціла новую сям’ю опенсорсных ШІ-мадэляў Llama 4. У яе ўвайшлі тры мультымадальныя мадэлі: Scout, Maverick і Behemoth, якія падтрымліваюць не толькі тэкставыя запыты, але таксама апрацоўваюць выявы, відэа і іншы кантэнт. Яны навучаліся на велізарным аб’ёме немаркіраваных тэкставых, графічных і відэаданых.

Як адзначае TechCrunch, поспех мадэляў DeepSeek, якія не горшыя або нават лепшыя за папярэднія пакаленні флагманскіх мадэляў Llama, прымусіў Meta паскорыць распрацоўку ў гэтым напрамку. А яе супрацоўнікі з усіх сіл спрабуюць зразумець, як кітайскі стартап здолеў знізіць кошт распрацоўкі і запуску мадэляў R1 і V3.

Llama 4 Scout мае 109 млрд параметраў, у тым ліку 17 млрд актыўных і 16 «экспертных», а кантэкстнае акно складае 10 млн токенаў. Meta сцвярджае, што яна пераўзыходзіць Gemma 3, Gemini 2.0 Flash-Lite і Mistral 3.1 у апрацоўцы розных тыпаў задач.

Llama 4 Maverick мае 400 млрд параметраў, у тым ліку 17 млрд актыўных і 128 «экспертных». Кантэкстнае акно — 1 млн токенаў. Паводле распрацоўшчыкаў, мадэль пераўзыходзіць GPT-4o і Gemini 2.0 Flash у розных бенчмарках, а таксама параўнальная з DeepSeek V3 у разважаннях і напісанні кода.

Llama 4 Behemoth мае каля 2 трлн параметраў, у тым ліку 288 млрд актыўных і 16 «экспертных». Яна апярэджвае ў бенчмарках GPT-4.5, Claude Sonnet 3.7 і Gemini 2.0 Pro. Мадэль працягвае навучанне, таму пакуль публічна недаступная. Scout і Maverick даступныя на сайце llama.com і на Hugging Face.

Акрамя гэтага, на Llama 4 у 40 краінах свету пераключаны фірменны ШІ-памочнік Meta AI, інтэграваны ў WhatsApp, Messenger і Instagram. Але апрацоўка мультымадальных запытаў пакуль абмежаваная англійскай мовай і даступная толькі ў ЗША.

Llama 4 — першая лінейка ШІ-мадэляў з «мультыэкспертнай» архітэктурай (mixture-of-experts, MoE), якая больш эфектыўная пры навучанні і інферэнсе. Такая архітэктура дазваляе мадэлі разбіваць задачы на падзадачы, а затым дэлегаваць іх больш дробным і спецыялізаваным «экспертным» мадэлям. Пры гэтым ніводная з мадэляў Llama 4 не з’яўляецца «разважальнай», як GPT-o1 або GPT-o3-mini ад OpenAI, якія пераправяраюць свае адказы перад тым, як выдаць іх карыстальніку.

Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Па тэме
Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
Па тэме
Meta пачала тэставаць першыя ўласныя чыпы для трэніроўкі ШІ
OpenAI выпусціць мадэль з адкрытымі вагамі каб дагнаць DeepSeek і Meta
OpenAI выпусціць мадэль з адкрытымі вагамі, каб дагнаць DeepSeek і Meta
Па тэме
OpenAI выпусціць мадэль з адкрытымі вагамі, каб дагнаць DeepSeek і Meta
Чытайце таксама
Пять новых профессиональных сертификаций от Meta на Cousera
Пять новых профессиональных сертификаций от Meta на Cousera
Пять новых профессиональных сертификаций от Meta на Cousera
Meta расширяет свое партнерство с Coursera, предлагая пять новых профессиональных сертификаций в области разработки ПО. Во время растущего спроса на квалифицированные кадры получение этих сертификатов позволит претендовать на самые востребованные позиции. По прогнозам, только в США к 2030 году сфера разработки ПО вырастет на 22%.Новые программы от Meta предлагают подготовку по следующим специальностям: фронтенд-разработчик, бэкенд-разработчик, Android-разработчик, iOS-разработчик и дата-инженер.
4 каментарыя
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
Соцсеть на мели: Meta хочет больше платных функций в Facebook, WhatsApp и Instagram
1 каментарый
Meta полностью прекратит поддержку приложения Facebook Gaming
Meta полностью прекратит поддержку приложения Facebook Gaming
Meta полностью прекратит поддержку приложения Facebook Gaming
Цукерберг: сотрудники Facebook влияли на выдачу рекомендаций в ленте соцсети
Цукерберг: сотрудники Facebook влияли на выдачу рекомендаций в ленте соцсети
Цукерберг: сотрудники Facebook влияли на выдачу рекомендаций в ленте соцсети
1 каментарый

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

Каментарыяў пакуль няма.