Microsoft выпусціла адразу тры ШІ-мадэлі: для тэксту, голасу і выяваў
Кампанія прадставіла тры новыя базавыя ШІ-мадэлі ўласнай распрацоўкі — MAI-Transcribe-1, MAI–Voice-1 і MAI–Image-2. Мадэлі ўжо даступныя праз платформу Microsoft Foundry і тэставае асяроддзе MAI Playground.
Кампанія прадставіла тры новыя базавыя ШІ-мадэлі ўласнай распрацоўкі — MAI-Transcribe-1, MAI–Voice-1 і MAI–Image-2. Мадэлі ўжо даступныя праз платформу Microsoft Foundry і тэставае асяроддзе MAI Playground.
Флагманскай распрацоўкай стала мадэль MAI-Transcribe-1 для пераўтварэння мовы ў тэкст. Паводле дадзеных кампаніі, яна дэманструе найлепшую дакладнасць на бэнчмарку FLEURS для 25 найбольш ужываных моваў і працуе ў 2,5 разы хутчэй за папярэдняе рашэнне Azure Fast. У Microsoft сцвярджаюць, што мадэль аптымізаваная для рэальных умоў — з шумам і нестабільным гукам.
Другая мадэль, MAI–Voice-1, прызначаная для генерацыі мовы. Яна здольная ствараць да 60 секунд аўдыё ўсяго за адну секунду, захоўваючы інтанацыі і асаблівасці голасу. Таксама распрацоўнікі дадалі магчымасць ствараць уласны голас на аснове некалькіх секунд запісу, што спрашчае стварэнне галасавых інтэрфэйсаў і ШІ-агентаў.
MAI–Image-2 адказвае за генерацыю выяваў і ўжо выкарыстоўваецца ў шэрагу прадуктаў кампаніі, у тым Bing і PowerPoint. Паводле дадзеных кампаніі, новая версія забяспечвае больш высокую хуткасць і якасць у параўнанні з папярэднімі рашэннямі.
Распрацоўкай мадэляў займалася каманда Microsoft AI пад кіраўніцтвам Мустафы Сулеймана, сфарміраваная ў канцы 2025 года. Паводле яго, кампанія робіць стаўку на практычнае прымяненне тэхналогій. «У Microsoft AI мы ствараем „гуманістычны ШІ“. Мы прытрымліваемся падыходу, пры якім чалавек знаходзіцца ў цэнтры — мадэлі навучаюцца пад рэальныя спосабы камунікацыі і практычныя задачы», — напісаў ён.
Пры гэтым Microsoft захоўвае стратэгічнае партнёрства з OpenAI, інвеставаўшы ў яго больш за $13 мільярдаў і працягваючы выкарыстоўваць яго мадэлі ў сваіх прадуктах. Аднак новыя распрацоўкі сведчаць пра імкненне кампаніі знізіць залежнасць ад знешніх пастаўшчыкоў тэхналогій і развіваць уласную ШІ-экасістэму.
Адным з ключавых фактараў канкурэнтаздольнасці Microsoft называе кошт. Паводле словаў Сулеймана, мадэлі наўмысна пазіцыянуюцца як больш танныя ў параўнанні з рашэннямі іншых воблачных правайдэраў, уключаючы Amazon і Google.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.