Китайский ИИ-стартап наделал шуму в Долине, обогнал ChatGPT в App Store, потянул вниз Nasdaq
Небольшой китайский ИИ-стартап DeepSeek разрабатывает большие языковые модели в условиях ограниченного бюджета и технических ресурсов. На прошлой неделе он выпустил модель R1, которая напугала представителей Кремниевой долины. Релиз заставил их задуматься, смогут ли более обеспеченные компании вроде Meta и Anthropic сохранить лидерство в сфере, пишет Financial Times.
R1 — «рассуждающая» модель с открытым исходным кодом на 671 млрд параметров. На некоторых ИИ-бенчмарках она не уступает o1 от OpenAI. Есть версии «полегче» на 1,5 млрд и 70 млрд параметров. Самая «тяжёлая» доступна через API DeepSeek по цене на 90-95% меньше, чем o1. Будучи китайской моделью, R1 зацензурирована и не отвечает на некоторые запросы. Для обучения модели стартапу потребовалось всего 2048 графических процессоров H800 от Nvidia и $5,6 млн, что в разы меньше затрат OpenAI и Google.
DeepSeek основал китайский миллиардер и управляющий хедж-фонда High-Flyer Лян Вэньфэн, уже ставший предметом гордости в своей стране. В 2021 году он начал тысячами скупать графические процессоры Nvidia для стороннего проекта по обучению моделей. Даже партнёры считали его чудаком, который ищет новые развлечения, и не воспринимали всерьёз. В High-Flyer Лян неплохо заработал на алгоритмах для поиска закономерностей, которые могли влиять на котировки акций. В 2023-м он запустил DeepSeek, заявив, что хочет разработать ИИ, не уступающий человеку, и собрал мощную команду.
Когда США запретили Nvidia поставлять передовые чипы в Китай, местным ИИ-компаниям пришлось искать способы максимизировать вычислительную мощность ограниченного количества имеющихся — и не самых продвинутых — процессоров. Эту проблему инженеры Ляна успешно решили.
Из-за фокуса DeepSeek исключительно на исследованиях, в которые вовлечён и фаундер, игроки отрасли видят в стартапе опасного конкурента. Он не брал инвестиций от внешних фондов и сам монетизирует свои модели. Инвесторы сравнивают DeepSeek с ранним DeepMind, когда тот занимался лишь исследованиями и разработками. Зарплаты сотрудникам DeepSeek Лян выплачивает из доходов своего хедж-фонда. Причём это зарплаты уровня ByteDance — самые высокие среди ИИ-специалистов в Китае. У DeepSeek есть офисы в Ханчжоу и Пекине. Сотрудники, которых набирает Лян, получали образование на родине, а не в США, а в ядре команды, по его словам, «нет людей, которые вернулись из-за рубежа». Он убеждён, что взращивать таланты нужно самостоятельно.
Калифорнийские эксперты отмечают, что первопроходцам в обучении моделей сложнее всего и они несут самые большие расходы, а последующие компании могут прогрессировать быстрее и дешевле. Также, по их словам, в Китае гораздо больше, чем в США, пул инженеров, которые знают, как оптимальнее использовать вычислительные ресурсы и делать модели дешевле. Но несмотря на огромный начальный успех DeepSeek игроки отрасли не уверены, что стартап сможет оставаться конкурентоспособной по мере развития ИИ-сферы.
По сообщению Bloomberg, приложение DeepSeek за выходные вышло в лидеры в бесплатном топе в американском сегменте App Store, обогнав ChatGPT. Фьючерсы на технологический индекс Nasdaq 100 в Азии сегодня снизились почти на 2%, а котировки Nvidia на премаркете упали на 10%.
Если Китаец что-то ляпнул смело делите это на 8. Они по своей природе могут только достаточно убого копировать, но не создавать что-то новое, вранье и безкультрие у них в крови. Местное образование не выдерживает никакой критики.
Можно и на больше делить. DeepSeek API стоит примерно в 50 раз дешевле, чем OpenAI O1 API. И заодно показывает все внутренние "мысли", а не только короткую выжимку, как OpenAI. Там бывают занятные рассуждения: https://pbs.twimg.com/media/GiIkJsqboAI87j_.jpg:large
и удобно это очень скажу я вам, а еще есть 100500 разных сервисов gov.pl где можно что то заполнить и потом распечатать, а можно и не заполнять а просто скачать и заполнить "от руки", но занести в ужонд бумажку все равно придется
Пользователь отредактировал комментарий 27 января 2025, 23:13
Недавно ходил [Часть комментария скрыта за нарушение правил общения. Вот они, их всего пять: https://devby.io/news/comments-2024] адрес на ID менять (не польша).
Всего 3 раза в течении 2х месяцев лично в рабочее время понадобилось прибыть. Естественно пришлось пошлину ещё заплатить (а не бесплатно за налоги).
Холоп стерпит, важнее же диктатора где то там свергнуть.
Пользователь отредактировал комментарий 28 января 2025, 00:33
Таких проектов-копий подходов десятилетней давности, которые только искусственно экстенсивно накачиваются у китайцев навалом. Некоторые собирают бабло с внутрикитайской аудитории, некоторые пробуют с международной.
У этого проекта просто сейчас фаза предшествующая монетизации, которая в свою очередь предшествует фазе слива)) поэтому и накрутка юзеров как реальных, так и ботов. Поэтому и отсутствие внешнего финансирования на на первых этапах, потому и высокие ЗП.
Дальше - либо быстро собрать с большого числа вкладчиков по немного денег, либо опять же быстро втюхать крупному покупателю или покупателям.
Если затянуть с монетизацией, то реальные флагманы внедрят новые фишки и уйдут вперед, а их продукт с новыми фишками скопирует уже другие молодые развивающиеся компании))
Пользователь отредактировал комментарий 28 января 2025, 07:48
Нет, не навалом. Они нашли способ применить reinforcement learning к LLM без участия человека или другого ИИ. Это биг дил. И создали reasoning модель, сравнимую с O1, которая самая крутая на сегодняшний день. И выложили это в общий доступ не только веса, но и код с инструкцией, как тренировать. И, если не врут, то стоило это все всего 5 миллионов, тогда как один только запуск новой модели OpenAI на Ark-AGI бенчмарках стоил 2 миллиона. А врут или нет, скоро это выяснится, т.к. можно проверить. Но вам, конечно все и так ясно и понятно.
Ребята из DeepSeek как раз и выбили табуретку с монетизацией из под OpenAI, Gemini, и Claude.ai.
Во многом расходы на чипы, датацентры и АЭС обнулились.
Работодатель и EU правительство не дали AI тулов. $20 не лишние.
DeepSeek работает неплохо. Для ресерчей сгодится.
А DeepSeek на конфиденциальных данных отобьётся.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
Счас как лясне! Бггг
Если Китаец что-то ляпнул смело делите это на 8. Они по своей природе могут только достаточно убого копировать, но не создавать что-то новое, вранье и безкультрие у них в крови. Местное образование не выдерживает никакой критики.
разделил на 8 и все равно круто
Можно и на больше делить. DeepSeek API стоит примерно в 50 раз дешевле, чем OpenAI O1 API. И заодно показывает все внутренние "мысли", а не только короткую выжимку, как OpenAI. Там бывают занятные рассуждения:
https://pbs.twimg.com/media/GiIkJsqboAI87j_.jpg:large
последний раз это закончилось COVID-19
Зато в EU крышечки к бутылочкам приделали, чтобы не падали.
и удобно это очень скажу я вам, а еще есть 100500 разных сервисов gov.pl где можно что то заполнить и потом распечатать, а можно и не заполнять а просто скачать и заполнить "от руки", но занести в ужонд бумажку все равно придется
Пользователь отредактировал комментарий 27 января 2025, 23:13
Недавно ходил [Часть комментария скрыта за нарушение правил общения. Вот они, их всего пять: https://devby.io/news/comments-2024] адрес на ID менять (не польша).
Всего 3 раза в течении 2х месяцев лично в рабочее время понадобилось прибыть. Естественно пришлось пошлину ещё заплатить (а не бесплатно за налоги).
Холоп стерпит, важнее же диктатора где то там свергнуть.
Пользователь отредактировал комментарий 28 января 2025, 00:33
Таких проектов-копий подходов десятилетней давности, которые только искусственно экстенсивно накачиваются у китайцев навалом. Некоторые собирают бабло с внутрикитайской аудитории, некоторые пробуют с международной.
У этого проекта просто сейчас фаза предшествующая монетизации, которая в свою очередь предшествует фазе слива)) поэтому и накрутка юзеров как реальных, так и ботов. Поэтому и отсутствие внешнего финансирования на на первых этапах, потому и высокие ЗП.
Дальше - либо быстро собрать с большого числа вкладчиков по немного денег, либо опять же быстро втюхать крупному покупателю или покупателям.
Если затянуть с монетизацией, то реальные флагманы внедрят новые фишки и уйдут вперед, а их продукт с новыми фишками скопирует уже другие молодые развивающиеся компании))
Пользователь отредактировал комментарий 28 января 2025, 07:48
Нет, не навалом. Они нашли способ применить reinforcement learning к LLM без участия человека или другого ИИ. Это биг дил. И создали reasoning модель, сравнимую с O1, которая самая крутая на сегодняшний день. И выложили это в общий доступ не только веса, но и код с инструкцией, как тренировать. И, если не врут, то стоило это все всего 5 миллионов, тогда как один только запуск новой модели OpenAI на Ark-AGI бенчмарках стоил 2 миллиона. А врут или нет, скоро это выяснится, т.к. можно проверить. Но вам, конечно все и так ясно и понятно.
Ребята из DeepSeek как раз и выбили табуретку с монетизацией из под OpenAI, Gemini, и Claude.ai.
Во многом расходы на чипы, датацентры и АЭС обнулились.
Работодатель и EU правительство не дали AI тулов. $20 не лишние.
DeepSeek работает неплохо. Для ресерчей сгодится.
А DeepSeek на конфиденциальных данных отобьётся.
В некоторых странах ChatGPT недоступно, DeepSeek там будет the game changer.
Пользователь отредактировал комментарий 28 января 2025, 12:45
Вот это самое важное отличие имхо. Пока США и Европа играются в санкции, Китай дружит со всеми и наращивает юзерскую базу х2.
Ой, ну ребята)) ну совсем же уши торчат))