Alibaba прэзентавала новую мультымадальную мадэль з адкрытым кодам

Alibaba Cloud анансавала мадэль Qwen2.5-Omni-7B з сямейства Qwen. Гэта мультымадальная мадэль з адкрытым зыходным кодам здольная апрацоўваць тэкст, выявы, аўдыё і відэа, генеруючы тэкставыя адказы і натуральную гаворку.

Пакінуць каментарый

Мадэль мае 7 мільярдаў параметраў і спалучае высокую эфектыўнасць з кампактнасцю, што робіць яе прыдатнай для разгортвання на edge-прыладах. Сярод магчымых ужыванняў — стварэнне аўдыяапісанняў для людзей з парушэннямі зроку або выкарыстанне ў інтэлектуальных сістэмах кліенцкай падтрымкі. У Alibaba Cloud падкрэсліваюць, што мультымадальнасць і магчымасць працы на прыладах карыстальнікаў робяць мадэль ідэальнай для эканамічна эфектыўных ШІ-рашэнняў.

Qwen2.5-Omni-7B — гэта ўніверсальная end-to-end мадэль. У яе ўбудаваны спецыяльныя тэхналогіі: Thinker-Talker Architecture падзяляе стварэнне тэксту і гаворкі, каб яны не перашкаджалі адно аднаму; TMRoPE дапамагае сінхранізаваць відэа і гук; а Block-wise Streaming Processing паскарае аўдыяадказы, памяншаючы затрымкі. Мадэль навучана на вялікім і разнастайным наборы дадзеных, які ўключае тэкст, выявы, відэа і аўдыё.

Доступ да Qwen2.5-Omni-7B адкрыты праз Hugging Face і GitHub, а ў будучыні яна з’явіцца ў Qwen Chat і ModelScope — open-source платформе Alibaba Cloud. Запуск мадэлі адбываецца на фоне абвастрэння канкурэнцыі ў сферы ШІ ў Кітаі, дзе Alibaba актыўна нарошчвае інвестыцыі. У лютым 2025 года кампанія абвясціла пра планы ўкласці больш за $52 млрд у воблачныя платформы і ШІ-інфраструктуру да 2028 года.

Сярод нядаўніх распрацовак — Qwen 2.5 (верасень 2024), Qwen 2.5-Max (студзень 2025) і QwQ-32B (сакавік 2025), якія паказалі вынікі, блізкія да лідараў рынку. Таксама былі прадстаўлены Qwen2.5-VL і Qwen2.5-1M для задач візуальнага аналізу і апрацоўкі доўгіх тэкстаў. Alibaba пашырае партнёрствы, у тым ліку супрацоўніцтва з Apple і BMW у сферы інтэграцыі ШІ.

Музычныя лэйблы не змаглі забараніць Anthropic навучаць ШІ на тэкстах песень
Па тэме
Музычныя лэйблы не змаглі забараніць Anthropic навучаць ШІ на тэкстах песень
Microsoft прэзентавала ШІ-агентаў для абароны ад кіберпагроз
Па тэме
Microsoft прэзентавала ШІ-агентаў для абароны ад кіберпагроз
Усе вядучыя мадэлі ШІ правалілі новы тэст на агульны інтэлект
Па тэме
Усе вядучыя мадэлі ШІ правалілі новы тэст на агульны інтэлект

Читать на dev.by