Найноўшую АІ-мадэль Anthropic называюць найлепшай у праграмаванні — і яе навучанне каштавала толькі некалькі дзясяткаў мільёнаў
Навучанне апошняй флагманскай мадэлі Claude 3.7 Sonnet абышлося Anthropic усяго ў «некалькі дзясяткаў мільёнаў долараў» і запатрабавала 10^14 тэрафлопсаў вылічальнай магутнасці. Пра гэта напісаў у Х АІ-даследчык і прафесар Пенсільванскага ўніверсітэта Ітан Молік. Данымі з ім падзяліліся ў кампаніі. Аднак там дадалі, што «будучыя мадэлі будуць нашмат буйнейшымі».
Калі на трэніроўку мадэлі, хай і без уліку спадарожных выдаткаў, сапраўды было выдаткавана столькі, колькі паказаў Молік, гэта значыць, што выпускаць перадавыя мадэлі становіцца ўсё танней, адзначае TechCrunch. Паводле слоў CEO Anthropic Дарыа Амадэя, навучанне Claude 3.5, якая выйшла ў свет мінулага верасня, таксама каштавала некалькі дзясяткаў мільёнаў.
Гэтыя лічбы параўнальныя з «цэнамі» топавых мадэляў 2023 года. Для параўнання: CEO OpenAI Сэм Альтман казаў, што на GPT-4 было выдаткавана больш за $100 млн, а Google, паводле ацэнак Стэнфарда, выдаткавала каля $200 млн на навучанне Gemini Ultra.
Пры гэтым Амадэй лічыць, што ў будучыні АІ-мадэлі будуць каштаваць мільярды долараў. TechCrunch падкрэслівае, што ў выдаткі на навучанне не ўключаны кошт дапаможнай працы, напрыклад, тэсціравання бяспекі і фундаментальных даследаванняў. Акрамя таго, цяпер галіна факусуецца на разважальных мадэлях, якія патрабуюць больш часу на апрацоўку складаных запытаў, і выдаткі на вылічэнні, якія яны здзяйсняюць, хутчэй за ўсё, працягнуць расці.
Пры гэтым карыстальнікі ўжо называюць Claude 3.7 Sonnet найлепшай мадэллю для задач па праграмаванні. На бэнчмарках яна пераўзыходзіць мадэлі OpenAI і DeepSeek.
Читать на dev.by