Александра Кукуть 24 ліпеня 2024, 11:47

Meta выпусціла самую вялікую і магутную оўпэнсорсную АІ-мадэль у свеце

Meta паказала найбуйнейшую ў свеце адкрытую АІ-мадэль Llama 3.1. Кампанія заяўляе, што прадукцыйнасцю яна пераўзыходзіць прыватныя мадэлі OpenAI і іншых канкурэнтаў, уключаючы GPT-4o і Claude 3.5 Sonnet ад Anthropic, на некаторых бэнчмарках. Яна выйшла наперад па агульных ведах, матэматыцы і моўным перакладзе.

3 каментарыя

Акрамя гэтага, кампанія пашырыла спіс краін і моў, падтрымваных яе АІ-асістэнтам, і дадала функцыю генерацыі малюнкаў. Марк Цукерберг лічыць, што пры канцы года Meta AI абгоніць ChatGPT па папулярнасці.

Llama 3.1 значна складанейшая за мадэлі Llama 3, якія былі выпушчаныя некалькі месяцаў таму. Старэйшая версія налічвае 405 млрд параметраў, а для яе навучання было задзейнічана 16 тысяч дарагіх GPU H100 ад Nvidia. Выдаткі на распрацоўку Llama 3.1 кампанія трымае ў сакрэце, але, нават калі зыходзіць толькі з кошту чыпаў Nvidia, сума можа дасягаць сотняў мільёнаў долараў.

Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире

По теме

Mistral AI и Nvidia представили корпоративную ИИ-модель со здравым смыслом и знаниями о мире

Цукерберг дадаў, што оўпэнсорсныя АІ-мадэлі ўжо развіваюцца хутчэй за прапрыетарныя і ў далейшым перасягнуць іх, а таксама правёў паралель з Linux. «Я перакананы, што рэліз Llama 3.1 стане пераломным момантам для галіны, пасля якога большасць распрацоўшчыкаў пачне пераважна карыстацца оўпэнсорсам», — напісаў прадпрымальнік.

Meta супрацоўнічае прыкладна з трыма дзесяткамі кампаній, уключаючы Microsoft, Amazon, Google, Nvidia і Databricks, каб дапамагаць распрацоўшчыкам разгортваць свае версіі мадэлі. У Meta кажуць, што эксплуатацыя Llama 3.1 абыходзіцца прыкладна ўдвая танней у параўнанні з GPT-4o. Таксама яна выклала вагі мадэлі, каб іншыя распрацоўшчыкі маглі трэніраваць яе на сваіх даных і кастамізаваць на сваё меркаванне. Інфармацыі пра даныя, на якіх навучалася Llama 3.1, Meta не раскрывае — акрамя таго, што выкарыстоўвала сінтэтычныя даныя, то-бок згенераваныя мадэллю, а не чалавекам, для паляпшэння малодшых Llama 3.1 на 70 млрд і 8 млрд параметраў з дапамогай старэйшай версіі.

Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў

Па тэме

Meta выпусціла Llama 3 — найлепшую сярод адкрытых мадэляў

Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini

По теме

Anthropic выпустила Claude 3.5 Sonnet — ИИ-модель опережает GPT-4o и Gemini

Читать на dev.by