Дапамажыце dev.by 🤍
Падтрымаць

Meta выпусціла самую вялікую і магутную оўпэнсорсную АІ-мадэль у свеце

Meta паказала найбуйнейшую ў свеце адкрытую АІ-мадэль Llama 3.1. Кампанія заяўляе, што прадукцыйнасцю яна пераўзыходзіць прыватныя мадэлі OpenAI і іншых канкурэнтаў, уключаючы GPT-4o і Claude 3.5 Sonnet ад Anthropic, на некаторых бэнчмарках. Яна выйшла наперад па агульных ведах, матэматыцы і моўным перакладзе.

3 каментарыя

Meta паказала найбуйнейшую ў свеце адкрытую АІ-мадэль Llama 3.1. Кампанія заяўляе, што прадукцыйнасцю яна пераўзыходзіць прыватныя мадэлі OpenAI і іншых канкурэнтаў, уключаючы GPT-4o і Claude 3.5 Sonnet ад Anthropic, на некаторых бэнчмарках. Яна выйшла наперад па агульных ведах, матэматыцы і моўным перакладзе.

Акрамя гэтага, кампанія пашырыла спіс краін і моў, падтрымваных яе АІ-асістэнтам, і дадала функцыю генерацыі малюнкаў. Марк Цукерберг лічыць, што пры канцы года Meta AI абгоніць ChatGPT па папулярнасці.

Llama 3.1 значна складанейшая за мадэлі Llama 3, якія былі выпушчаныя некалькі месяцаў таму. Старэйшая версія налічвае 405 млрд параметраў, а для яе навучання было задзейнічана 16 тысяч дарагіх GPU H100 ад Nvidia. Выдаткі на распрацоўку Llama 3.1 кампанія трымае ў сакрэце, але, нават калі зыходзіць толькі з кошту чыпаў Nvidia, сума можа дасягаць сотняў мільёнаў долараў.

Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире
Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире
По теме
Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире

Цукерберг дадаў, што оўпэнсорсныя АІ-мадэлі ўжо развіваюцца хутчэй за прапрыетарныя і ў далейшым перасягнуць іх, а таксама правёў паралель з Linux. «Я перакананы, што рэліз Llama 3.1 стане пераломным момантам для галіны, пасля якога большасць распрацоўшчыкаў пачне пераважна карыстацца оўпэнсорсам», — напісаў прадпрымальнік.

Meta супрацоўнічае прыкладна з трыма дзесяткамі кампаній, уключаючы Microsoft, Amazon, Google, Nvidia і Databricks, каб дапамагаць распрацоўшчыкам разгортваць свае версіі мадэлі. У Meta кажуць, што эксплуатацыя Llama 3.1 абыходзіцца прыкладна ўдвая танней у параўнанні з GPT-4o. Таксама яна выклала вагі мадэлі, каб іншыя распрацоўшчыкі маглі трэніраваць яе на сваіх даных і кастамізаваць на сваё меркаванне. Інфармацыі пра даныя, на якіх навучалася Llama 3.1, Meta не раскрывае — акрамя таго, што выкарыстоўвала сінтэтычныя даныя, то-бок згенераваныя мадэллю, а не чалавекам, для паляпшэння малодшых Llama 3.1 на 70 млрд і 8 млрд параметраў з дапамогай старэйшай версіі.

Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Па тэме
Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini
По теме
Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Абмеркаванне
Каментуйце без абмежаванняў

Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.

1

гонево

1

Их достаточно неплохо умеют расцензуривать. Прогоняют через специальные датасеты на снятие цензуры и добавляют инструкций. Плюс во всяких чатах гпт половина цензуры случается еще до входа в модель - тупо анализируют запросы на табу темы и заставляют модель отказываться отвечать. То есть это не ее внутренняя логика, а принудительная команда отказаться отвечать. На huggingface есть расцензуренные версии всех предыдущих "Ламм", так что и эта скоро подтянется. Правда, страшно представлять, сколько ей нужно железа для запуска

0

А куда делся комментарий, на который я отвечал? Вроде бы, там не было ничего криминального