Microsoft паказала малую АІ-мадэль, якая можа канкураваць з «вялікімі» LLM
Кампанія паказала перадавую мадэль Phi-2, якая можа канкураваць і нават пераўзыходзіць іншыя АІ-мадэлі. Сістэма налічвае 2,7 мільярда параметраў і ўжо даступная праз Microsoft Azure AI Studio для даследчыкаў і распрацоўшчыкаў.
Гендырэктар Microsoft Сацья Надэла паказаў мадэль Phi-2 на мерапрыемстве Ignite. Phi-2 з’яўляецца працягам серыі малых моўных мадэляў (SLMs) кампаніі Microsoft, накіраваных на павышэнне якасці і эфектыўнасці навучання АІ.
Асаблівасць Phi-2 — навучанне на даных, якія адпавядаюць якасці навучальнага ўзроўню. Гэта значыць, што даныя для навучання былі старанна адабраныя і структураваныя. Такі падыход дазваляе мадэлі больш эфектыўна пераносіць веды, атрыманыя з іншых мадэляў.
Распрацоўшчыкі сцвярджаюць, што Phi-2 пераўзыходзіць Gemini Nano — самую эфектыўную мадэль серыі Gemini кампаніі Google, прызначаную для выкарыстання на мабільных прыладах. Акрамя таго, Phi-2 супастаўная з вялікімі АІ-мадэлямі, такімі як 7B Mistral кампаніі Mistral AI, 13B Llama 2 і 70B Llama 2 кампаніі Meta.
Спецыялісты адзначаюць, што высокая прадукцыйнасць Phi-2 дасягнутая без прымянення метаду навучання з падмацаваннем або метадаў інструкцыйнага наладжвання. Такім чынам памяншаюцца праявы перадузятасці мадэлі і зніжаецца рызыка таксічных выходных даных. Першая мадэль гэтай серыі Phi-1 з 1,3 мільярда параметраў выйшла раней у гэтым годзе.
Читать на dev.by