Нужно +94 подписчика в июне. Поддержите devby 📝
Support us

Техногиганты делают ставку на малые ИИ-модели из-за дороговизны больших

ИИ-компании тратят миллиарды долларов на создание больших языковых моделей, но теперь отдают предпочтение их малым «собратьям»: за последнее время Apple, Microsoft, Meta и Google выпустили модели с меньшим числом параметров, но при этом довольно мощных, пишет Financial Times.

Оставить комментарий
Техногиганты делают ставку на малые ИИ-модели из-за дороговизны больших

ИИ-компании тратят миллиарды долларов на создание больших языковых моделей, но теперь отдают предпочтение их малым «собратьям»: за последнее время Apple, Microsoft, Meta и Google выпустили модели с меньшим числом параметров, но при этом довольно мощных, пишет Financial Times.

Чем больше параметров у модели, тем лучше её производительность и тем более сложные задачи она может выполнять. У новейших GPT-4o от OpenAI и Gemini 1.5 Pro от Google более 1 трлн параметров, а Meta тренирует версию опенсорсной модели Llama на 400 млрд параметров.

Малые модели дешевле и требуют меньше вычислительных мощностей, поэтому их и продукты на базе генеративного ИИ, в основе которых они лежат, проще продать корпоративным клиентам.

В результате разработчики стали продвигать модели, у которых всего несколько миллиардов параметров, как более доступные, энергоэффективные и кастомизируемые альтернативы, требующие меньше ресурсов для обучения и работы и гарантирующие защиту чувствительных данных.

Microsoft: 3 из 4 сотрудников используют ИИ на работе
Microsoft: 3 из 4 сотрудников используют ИИ на работе
По теме
Microsoft: 3 из 4 сотрудников используют ИИ на работе

Google, Meta, Microsoft и французский стартап Mistral выпустили малые языковые модели с продвинутыми возможностями, которые могут быть заточены под конкретные задачи. Именно такие модели выгоднее иметь клиентам, и это будет способствовать более широкому внедрению ИИ. К тому же вычисления в случае малых моделей могут выполняться локально на устройстве без необходимости отправлять данные в облако и без опасений в утечках.

Meta заявляет, что новая версия Llama 3 на 8 млрд параметров сравнима по производительности с GPT-4. Microsoft утверждает, что её малая модель Phi-3 на 7 млрд параметров превосходит GPT-3.5. Gemini Nano от Google поддерживается на смартфонах, Apple тоже намекнула, что готовит модель, которая будет работать на айфонах.

OpenAI тоже предлагает модели поменьше, которые предназначены для некоторых более узких целей. Но остаётся сосредоточена именно на больших моделях, которые в конечном счёте должны достичь интеллектуального уровня человека.

Meta выпустила Llama 3 — лучшую среди открытых моделей
Meta выпустила Llama 3 — лучшую среди открытых моделей
По теме
Meta выпустила Llama 3 — лучшую среди открытых моделей
Конференция Google I/O 2024: главное
Конференция Google I/O 2024: главное
По теме
Конференция Google I/O 2024: главное
Microsoft показала малую ИИ-модель которая может конкурировать с «большими» LLM
Microsoft показала малую ИИ-модель, которая может конкурировать с «большими» LLM
По теме
Microsoft показала малую ИИ-модель, которая может конкурировать с «большими» LLM
Нужно +94 подписчика в июне.

Поддержите devby

Читайте также
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Пять новых профессиональных сертификаций от Meta на Cousera
Пять новых профессиональных сертификаций от Meta на Cousera
Пять новых профессиональных сертификаций от Meta на Cousera
Meta расширяет свое партнерство с Coursera, предлагая пять новых профессиональных сертификаций в области разработки ПО. Во время растущего спроса на квалифицированные кадры получение этих сертификатов позволит претендовать на самые востребованные позиции. По прогнозам, только в США к 2030 году сфера разработки ПО вырастет на 22%.Новые программы от Meta предлагают подготовку по следующим специальностям: фронтенд-разработчик, бэкенд-разработчик, Android-разработчик, iOS-разработчик и дата-инженер.
4 комментария
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
Google урезает бюджеты, СЕО намекает на сокращения
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.