Отдел новостей 27 января 2025, 14:25

Китайский ИИ-стартап наделал шуму в Долине, обогнал ChatGPT в App Store, потянул вниз Nasdaq

Небольшой китайский ИИ-стартап DeepSeek разрабатывает большие языковые модели в условиях ограниченного бюджета и технических ресурсов. На прошлой неделе он выпустил модель R1, которая напугала представителей Кремниевой долины. Релиз заставил их задуматься, смогут ли более обеспеченные компании вроде Meta и Anthropic сохранить лидерство в сфере, пишет Financial Times.

15 комментариев

Китайский ИИ-стартап наделал шуму в Долине, обогнал ChatGPT в App Store, потянул вниз Nasdaq

R1 — «рассуждающая» модель с открытым исходным кодом на 671 млрд параметров. На некоторых ИИ-бенчмарках она не уступает o1 от OpenAI. Есть версии «полегче» на 1,5 млрд и 70 млрд параметров. Самая «тяжёлая» доступна через API DeepSeek по цене на 90-95% меньше, чем o1. Будучи китайской моделью, R1 зацензурирована и не отвечает на некоторые запросы. Для обучения модели стартапу потребовалось всего 2048 графических процессоров H800 от Nvidia и $5,6 млн, что в разы меньше затрат OpenAI и Google.

DeepSeek основал китайский миллиардер и управляющий хедж-фонда High-Flyer Лян Вэньфэн, уже ставший предметом гордости в своей стране. В 2021 году он начал тысячами скупать графические процессоры Nvidia для стороннего проекта по обучению моделей. Даже партнёры считали его чудаком, который ищет новые развлечения, и не воспринимали всерьёз. В High-Flyer Лян неплохо заработал на алгоритмах для поиска закономерностей, которые могли влиять на котировки акций. В 2023-м он запустил DeepSeek, заявив, что хочет разработать ИИ, не уступающий человеку, и собрал мощную команду.

Когда США запретили Nvidia поставлять передовые чипы в Китай, местным ИИ-компаниям пришлось искать способы максимизировать вычислительную мощность ограниченного количества имеющихся — и не самых продвинутых — процессоров. Эту проблему инженеры Ляна успешно решили.

Из-за фокуса DeepSeek исключительно на исследованиях, в которые вовлечён и фаундер, игроки отрасли видят в стартапе опасного конкурента. Он не брал инвестиций от внешних фондов и сам монетизирует свои модели. Инвесторы сравнивают DeepSeek с ранним DeepMind, когда тот занимался лишь исследованиями и разработками. Зарплаты сотрудникам DeepSeek Лян выплачивает из доходов своего хедж-фонда. Причём это зарплаты уровня ByteDance — самые высокие среди ИИ-специалистов в Китае. У DeepSeek есть офисы в Ханчжоу и Пекине. Сотрудники, которых набирает Лян, получали образование на родине, а не в США, а в ядре команды, по его словам, «нет людей, которые вернулись из-за рубежа». Он убеждён, что взращивать таланты нужно самостоятельно.

Калифорнийские эксперты отмечают, что первопроходцам в обучении моделей сложнее всего и они несут самые большие расходы, а последующие компании могут прогрессировать быстрее и дешевле. Также, по их словам, в Китае гораздо больше, чем в США, пул инженеров, которые знают, как оптимальнее использовать вычислительные ресурсы и делать модели дешевле. Но несмотря на огромный начальный успех DeepSeek игроки отрасли не уверены, что стартап сможет оставаться конкурентоспособной по мере развития ИИ-сферы.

По сообщению Bloomberg, приложение DeepSeek за выходные вышло в лидеры в бесплатном топе в американском сегменте App Store, обогнав ChatGPT. Фьючерсы на технологический индекс Nasdaq 100 в Азии сегодня снизились почти на 2%, а котировки Nvidia на премаркете упали на 10%.

Stargate — мегастартап США в cфере ИИ. Что о нем известно

OpenAI запустила ИИ-агента который может купить продукты и забронировать билеты вместо пользователя

Google: до конца года будут протестированы лекарства созданные ИИ, а «миллиарды» ИИ-агентов заставят переосмыслить «Всемирную паутину»

15 комментариев

Текст: Отдел новостей Фото: DeepSeek Источник: Financial Times Теги: deepseek, большая языковая модель, искусственный интеллект, модели

Нашли ошибку в тексте-выделите ее и нажмите Ctrl+Enter. Нашли ошибку в тексте-выделите ее и нажмите кнопку «Сообщить об ошибке»."

Сайт компании Вакансии

Размещение рекламы

Claude взломал билетную систему крупнейших фестивалей США

Воры охотятся за медью и оборудованием для ИИ-дата-центров

Синдром «няньки для роботов»: топ-менеджер уволила половину своих ИИ-агентов

«Я не могу сесть в этот поезд»: что разрабы на самом деле думают об ИИ-кодинге

Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

povelitel-krasnogo-drakona Проектный мессенджер в 我想排便

Счас как лясне! Бггг

user113745

Если Китаец что-то ляпнул смело делите это на 8. Они по своей природе могут только достаточно убого копировать, но не создавать что-то новое, вранье и безкультрие у них в крови. Местное образование не выдерживает никакой критики.

razrabotchik

разделил на 8 и все равно круто

Alex V

-3

Можно и на больше делить. DeepSeek API стоит примерно в 50 раз дешевле, чем OpenAI O1 API. И заодно показывает все внутренние "мысли", а не только короткую выжимку, как OpenAI. Там бывают занятные рассуждения:
https://pbs.twimg.com/media/GiIkJsqboAI87j_.jpg:large

table Table в Database

последний раз это закончилось COVID-19

3rak1u8

Зато в EU крышечки к бутылочкам приделали, чтобы не падали.

razrabotchik

и удобно это очень скажу я вам, а еще есть 100500 разных сервисов gov.pl где можно что то заполнить и потом распечатать, а можно и не заполнять а просто скачать и заполнить "от руки", но занести в ужонд бумажку все равно придется

Пользователь отредактировал комментарий 27 января 2025, 23:13

3rak1u8

Недавно ходил [Часть комментария скрыта за нарушение правил общения. Вот они, их всего пять: https://devby.io/news/comments-2024] адрес на ID менять (не польша).
Всего 3 раза в течении 2х месяцев лично в рабочее время понадобилось прибыть. Естественно пришлось пошлину ещё заплатить (а не бесплатно за налоги).
Холоп стерпит, важнее же диктатора где то там свергнуть.

Пользователь отредактировал комментарий 28 января 2025, 00:33

hottaby422 Консультант в Сам себе буратино

Таких проектов-копий подходов десятилетней давности, которые только искусственно экстенсивно накачиваются у китайцев навалом. Некоторые собирают бабло с внутрикитайской аудитории, некоторые пробуют с международной.
У этого проекта просто сейчас фаза предшествующая монетизации, которая в свою очередь предшествует фазе слива)) поэтому и накрутка юзеров как реальных, так и ботов. Поэтому и отсутствие внешнего финансирования на на первых этапах, потому и высокие ЗП.
Дальше - либо быстро собрать с большого числа вкладчиков по немного денег, либо опять же быстро втюхать крупному покупателю или покупателям.
Если затянуть с монетизацией, то реальные флагманы внедрят новые фишки и уйдут вперед, а их продукт с новыми фишками скопирует уже другие молодые развивающиеся компании))

Пользователь отредактировал комментарий 28 января 2025, 07:48

Alex V

-2

Нет, не навалом. Они нашли способ применить reinforcement learning к LLM без участия человека или другого ИИ. Это биг дил. И создали reasoning модель, сравнимую с O1, которая самая крутая на сегодняшний день. И выложили это в общий доступ не только веса, но и код с инструкцией, как тренировать. И, если не врут, то стоило это все всего 5 миллионов, тогда как один только запуск новой модели OpenAI на Ark-AGI бенчмарках стоил 2 миллиона. А врут или нет, скоро это выяснится, т.к. можно проверить. Но вам, конечно все и так ясно и понятно.

3rak1u8

-1

Ребята из DeepSeek как раз и выбили табуретку с монетизацией из под OpenAI, Gemini, и Claude.ai.
Во многом расходы на чипы, датацентры и АЭС обнулились.

3rak1u8

-1

Работодатель и EU правительство не дали AI тулов. $20 не лишние.
DeepSeek работает неплохо. Для ресерчей сгодится.
А DeepSeek на конфиденциальных данных отобьётся.

3rak1u8

В некоторых странах ChatGPT недоступно, DeepSeek там будет the game changer.

Пользователь отредактировал комментарий 28 января 2025, 12:45

rotragoydo

-2

Вот это самое важное отличие имхо. Пока США и Европа играются в санкции, Китай дружит со всеми и наращивает юзерскую базу х2.

hottaby422 Консультант в Сам себе буратино

-2

Ой, ну ребята)) ну совсем же уши торчат))

Войдите, чтобы оставить комментарий