Живете в Польше? Поддержите devby 1,5% налога: бесплатно и за 5 минут 🤗
Support us

Новая ИИ-модель DeepSeek сделает работу вдвое дешевле предыдущей

Компания выпустила экспериментальную модель V3.2-Exp с новой архитектурой Sparse Attention. Технология позволяет значительно снизить вычислительные расходы при работе с длинным контекстом и вдвое сократить стоимость API-запросов.

Оставить комментарий
Новая ИИ-модель DeepSeek сделает работу вдвое дешевле предыдущей

Компания выпустила экспериментальную модель V3.2-Exp с новой архитектурой Sparse Attention. Технология позволяет значительно снизить вычислительные расходы при работе с длинным контекстом и вдвое сократить стоимость API-запросов.

Ключевой элемент системы — модуль Lightning Indexer, который отбирает наиболее важные фрагменты текста для обработки. Далее система выбирает конкретные токены внутри этих фрагментов, загружая их в ограниченное «окно внимания». Такой подход позволяет модели эффективно работать с большими объемами текста без чрезмерной нагрузки на серверы.

Предварительные тесты DeepSeek показали, что в долгих сессиях стоимость одного API-вызова может снизиться на 50%. Хотя пока независимые эксперименты не подтверждали эти данные, модель уже доступна на Hugging Face в открытом доступе, а исходная статья опубликована на GitHub.

Сравнение результатов бенчмарков моделей DeepSeek-V3.1-Terminus и новой экспериментальной DeepSeek-V3.2-Exp. Источник: DeepSeek.

Sparse Attention не является новой идеей: похожие методы использовались OpenAI и Google в предыдущих поколениях моделей. Однако DeepSeek утверждает, что впервые реализовала эффективный вариант технологии, который сочетает качество и эффективность.

Ранее DeepSeek утверждала, что ее модель R1 сумела показать результаты, сопоставимые с OpenAI, при гораздо меньших затратах на обучение. Эксперты отмечают, что успех V3.2-Exp может оказать влияние на всю индустрию: снижение затрат на инференс позволит компаниям предоставлять ИИ-сервисы дешевле и быстрее, особенно при работе с длинными контекстами.

OpenAI запустила «свой TikTok» с генератором видео Sora
OpenAI запустила «свой TikTok» с генератором видео Sora
По теме
OpenAI запустила «свой TikTok» с генератором видео Sora
ChatGPT научился шопингу — покупки можно делать прямо в чате
ChatGPT научился шопингу — покупки можно делать прямо в чате
По теме
ChatGPT научился шопингу — покупки можно делать прямо в чате
«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов
«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов
По теме
«Лучший в мире ИИ для кодинга» от Anthropic работает автономно до 30 часов
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
ИИ обвалил акции финансовых компаний
ИИ обвалил акции финансовых компаний
ИИ обвалил акции финансовых компаний
Cisco представила новый ИИ-чип для сетевой инфраструктуры, посоперничает с Nvidia и Broadcom
Cisco представила новый ИИ-чип для сетевой инфраструктуры, посоперничает с Nvidia и Broadcom
Cisco представила новый ИИ-чип для сетевой инфраструктуры, посоперничает с Nvidia и Broadcom
«Она спасла мне жизнь»: OpenAI отключает GPT-4o — пользователи взбунтовались
«Она спасла мне жизнь»: OpenAI отключает GPT-4o — пользователи взбунтовались
«Она спасла мне жизнь»: OpenAI отключает GPT-4o — пользователи взбунтовались
Компании рискуют стать «машинами для выгорания» из-за ИИ — исследование
Компании рискуют стать «машинами для выгорания» из-за ИИ — исследование
Компании рискуют стать «машинами для выгорания» из-за ИИ — исследование

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.