Техногиганты делают ставку на малые ИИ-модели из-за дороговизны больших
ИИ-компании тратят миллиарды долларов на создание больших языковых моделей, но теперь отдают предпочтение их малым «собратьям»: за последнее время Apple, Microsoft, Meta и Google выпустили модели с меньшим числом параметров, но при этом довольно мощных, пишет Financial Times.
Чем больше параметров у модели, тем лучше её производительность и тем более сложные задачи она может выполнять. У новейших GPT-4o от OpenAI и Gemini 1.5 Pro от Google более 1 трлн параметров, а Meta тренирует версию опенсорсной модели Llama на 400 млрд параметров.
Малые модели дешевле и требуют меньше вычислительных мощностей, поэтому их и продукты на базе генеративного ИИ, в основе которых они лежат, проще продать корпоративным клиентам.
В результате разработчики стали продвигать модели, у которых всего несколько миллиардов параметров, как более доступные, энергоэффективные и кастомизируемые альтернативы, требующие меньше ресурсов для обучения и работы и гарантирующие защиту чувствительных данных.
Google, Meta, Microsoft и французский стартап Mistral выпустили малые языковые модели с продвинутыми возможностями, которые могут быть заточены под конкретные задачи. Именно такие модели выгоднее иметь клиентам, и это будет способствовать более широкому внедрению ИИ. К тому же вычисления в случае малых моделей могут выполняться локально на устройстве без необходимости отправлять данные в облако и без опасений в утечках.
Meta заявляет, что новая версия Llama 3 на 8 млрд параметров сравнима по производительности с GPT-4. Microsoft утверждает, что её малая модель Phi-3 на 7 млрд параметров превосходит GPT-3.5. Gemini Nano от Google поддерживается на смартфонах, Apple тоже намекнула, что готовит модель, которая будет работать на айфонах.
OpenAI тоже предлагает модели поменьше, которые предназначены для некоторых более узких целей. Но остаётся сосредоточена именно на больших моделях, которые в конечном счёте должны достичь интеллектуального уровня человека.
10+ сертификаций Coursera, которые могут изменить вашу карьеру
Бюджетный способ прокачать навыки и повысить зарплату — это профессиональный сертификат от Google, IBM или крупного зарубежного университета. На Coursera как раз можно найти десятки полезных обучающих программ по машинному обучению, проджект-менеджменту и не только. Собрали 10+ сертификаций, которые будут выигрышно смотреться в резюме как новичка, так и опытного специалиста.
Дизайн, VR и интернет вещей: 10 доступных онлайн-курсов от Google, Amazon и других гигантов
На платформе Coursera можно найти сотни курсов от крупных корпораций, включая Google, Amazon и HubSpot. Это отличная возможность начать новую карьеру, повысить квалификацию и просто получить плюс в профессиональную карму. Мы собрали 10 программ от ИТ-компаний, которые помогут освоить машинное обучение, UX-дизайн, продакт-менеджмент, кибербезопасность и многое другое.
Пять новых профессиональных сертификаций от Meta на Cousera
Meta расширяет свое партнерство с Coursera, предлагая пять новых профессиональных сертификаций в области разработки ПО. Во время растущего спроса на квалифицированные кадры получение этих сертификатов позволит претендовать на самые востребованные позиции. По прогнозам, только в США к 2030 году сфера разработки ПО вырастет на 22%.Новые программы от Meta предлагают подготовку по следующим специальностям: фронтенд-разработчик, бэкенд-разработчик, Android-разработчик, iOS-разработчик и дата-инженер.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.