Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами! Это просто и ничего не стоит
Support us

Китайский ИИ-стартап наделал шуму в Долине, обогнал ChatGPT в App Store, потянул вниз Nasdaq

Небольшой китайский ИИ-стартап DeepSeek разрабатывает большие языковые модели в условиях ограниченного бюджета и технических ресурсов. На прошлой неделе он выпустил модель R1, которая напугала представителей Кремниевой долины. Релиз заставил их задуматься, смогут ли более обеспеченные компании вроде Meta и Anthropic сохранить лидерство в сфере, пишет Financial Times.

15 комментариев
Китайский ИИ-стартап наделал шуму в Долине, обогнал ChatGPT в App Store, потянул вниз Nasdaq

Небольшой китайский ИИ-стартап DeepSeek разрабатывает большие языковые модели в условиях ограниченного бюджета и технических ресурсов. На прошлой неделе он выпустил модель R1, которая напугала представителей Кремниевой долины. Релиз заставил их задуматься, смогут ли более обеспеченные компании вроде Meta и Anthropic сохранить лидерство в сфере, пишет Financial Times.

R1 — «рассуждающая» модель с открытым исходным кодом на 671 млрд параметров. На некоторых ИИ-бенчмарках она не уступает o1 от OpenAI. Есть версии «полегче» на 1,5 млрд и 70 млрд параметров. Самая «тяжёлая» доступна через API DeepSeek по цене на 90-95% меньше, чем o1. Будучи китайской моделью, R1 зацензурирована и не отвечает на некоторые запросы. Для обучения модели стартапу потребовалось всего 2048 графических процессоров H800 от Nvidia и $5,6 млн, что в разы меньше затрат OpenAI и Google.

DeepSeek основал китайский миллиардер и управляющий хедж-фонда High-Flyer Лян Вэньфэн, уже ставший предметом гордости в своей стране. В 2021 году он начал тысячами скупать графические процессоры Nvidia для стороннего проекта по обучению моделей. Даже партнёры считали его чудаком, который ищет новые развлечения, и не воспринимали всерьёз. В High-Flyer Лян неплохо заработал на алгоритмах для поиска закономерностей, которые могли влиять на котировки акций. В 2023-м он запустил DeepSeek, заявив, что хочет разработать ИИ, не уступающий человеку, и собрал мощную команду.

Когда США запретили Nvidia поставлять передовые чипы в Китай, местным ИИ-компаниям пришлось искать способы максимизировать вычислительную мощность ограниченного количества имеющихся — и не самых продвинутых — процессоров. Эту проблему инженеры Ляна успешно решили.

Из-за фокуса DeepSeek исключительно на исследованиях, в которые вовлечён и фаундер, игроки отрасли видят в стартапе опасного конкурента. Он не брал инвестиций от внешних фондов и сам монетизирует свои модели. Инвесторы сравнивают DeepSeek с ранним DeepMind, когда тот занимался лишь исследованиями и разработками. Зарплаты сотрудникам DeepSeek Лян выплачивает из доходов своего хедж-фонда. Причём это зарплаты уровня ByteDance — самые высокие среди ИИ-специалистов в Китае. У DeepSeek есть офисы в Ханчжоу и Пекине. Сотрудники, которых набирает Лян, получали образование на родине, а не в США, а в ядре команды, по его словам, «нет людей, которые вернулись из-за рубежа». Он убеждён, что взращивать таланты нужно самостоятельно.

Калифорнийские эксперты отмечают, что первопроходцам в обучении моделей сложнее всего и они несут самые большие расходы, а последующие компании могут прогрессировать быстрее и дешевле. Также, по их словам, в Китае гораздо больше, чем в США, пул инженеров, которые знают, как оптимальнее использовать вычислительные ресурсы и делать модели дешевле. Но несмотря на огромный начальный успех DeepSeek игроки отрасли не уверены, что стартап сможет оставаться конкурентоспособной по мере развития ИИ-сферы.

По сообщению Bloomberg, приложение DeepSeek за выходные вышло в лидеры в бесплатном топе в американском сегменте App Store, обогнав ChatGPT. Фьючерсы на технологический индекс Nasdaq 100 в Азии сегодня снизились почти на 2%, а котировки Nvidia на премаркете упали на 10%.

Stargate — мегастартап США в cфере ИИ. Что о нем известно
Stargate — мегастартап США в сфере ИИ. Что о нем известно
По теме
Stargate — мегастартап США в сфере ИИ. Что о нем известно
OpenAI запустила ИИ-агента который может купить продукты и забронировать билеты вместо пользователя
OpenAI запустила ИИ-агента, который может купить продукты и забронировать билеты вместо пользователя
По теме
OpenAI запустила ИИ-агента, который может купить продукты и забронировать билеты вместо пользователя
Perplexity запустил ИИ-ассистента
Perplexity запустил ИИ-ассистента
По теме
Perplexity запустил ИИ-ассистента
Google: до конца года будут протестированы лекарства созданные ИИ, а «миллиарды» ИИ-агентов заставят переосмыслить «Всемирную паутину»
Google: до конца года будут протестированы лекарства, созданные ИИ, а «миллиарды» ИИ-агентов заставят переосмыслить «Всемирную паутину»
По теме
Google: до конца года будут протестированы лекарства, созданные ИИ, а «миллиарды» ИИ-агентов заставят переосмыслить «Всемирную паутину»
Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами!

Это просто и ничего не стоит

Читайте также
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
4 комментария
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
В России создали бесплатного конкурента генератора картинок DALL-E 2
2 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

povelitel-krasnogo-drakona
povelitel-krasnogo-drakona Проектный мессенджер в 我想排便
1

Счас как лясне! Бггг

3

Если Китаец что-то ляпнул смело делите это на 8. Они по своей природе могут только достаточно убого копировать, но не создавать что-то новое, вранье и безкультрие у них в крови. Местное образование не выдерживает никакой критики.

1

разделил на 8 и все равно круто

-3

Можно и на больше делить. DeepSeek API стоит примерно в 50 раз дешевле, чем OpenAI O1 API. И заодно показывает все внутренние "мысли", а не только короткую выжимку, как OpenAI. Там бывают занятные рассуждения:
https://pbs.twimg.com/media/GiIkJsqboAI87j_.jpg:large

table
table Table в Database
6

последний раз это закончилось COVID-19

2

Зато в EU крышечки к бутылочкам приделали, чтобы не падали.

0

и удобно это очень скажу я вам, а еще есть 100500 разных сервисов gov.pl где можно что то заполнить и потом распечатать, а можно и не заполнять а просто скачать и заполнить "от руки", но занести в ужонд бумажку все равно придется

Пользователь отредактировал комментарий 27 января 2025, 23:13

2

Недавно ходил [Часть комментария скрыта за нарушение правил общения. Вот они, их всего пять: https://devby.io/news/comments-2024] адрес на ID менять (не польша).
Всего 3 раза в течении 2х месяцев лично в рабочее время понадобилось прибыть. Естественно пришлось пошлину ещё заплатить (а не бесплатно за налоги).
Холоп стерпит, важнее же диктатора где то там свергнуть.

Пользователь отредактировал комментарий 28 января 2025, 00:33

hottaby422
hottaby422 Консультант в Сам себе буратино
0

Таких проектов-копий подходов десятилетней давности, которые только искусственно экстенсивно накачиваются у китайцев навалом. Некоторые собирают бабло с внутрикитайской аудитории, некоторые пробуют с международной.
У этого проекта просто сейчас фаза предшествующая монетизации, которая в свою очередь предшествует фазе слива)) поэтому и накрутка юзеров как реальных, так и ботов. Поэтому и отсутствие внешнего финансирования на на первых этапах, потому и высокие ЗП.
Дальше - либо быстро собрать с большого числа вкладчиков по немного денег, либо опять же быстро втюхать крупному покупателю или покупателям.
Если затянуть с монетизацией, то реальные флагманы внедрят новые фишки и уйдут вперед, а их продукт с новыми фишками скопирует уже другие молодые развивающиеся компании))

Пользователь отредактировал комментарий 28 января 2025, 07:48

-2

Нет, не навалом. Они нашли способ применить reinforcement learning к LLM без участия человека или другого ИИ. Это биг дил. И создали reasoning модель, сравнимую с O1, которая самая крутая на сегодняшний день. И выложили это в общий доступ не только веса, но и код с инструкцией, как тренировать. И, если не врут, то стоило это все всего 5 миллионов, тогда как один только запуск новой модели OpenAI на Ark-AGI бенчмарках стоил 2 миллиона. А врут или нет, скоро это выяснится, т.к. можно проверить. Но вам, конечно все и так ясно и понятно.

0

Ребята из DeepSeek как раз и выбили табуретку с монетизацией из под OpenAI, Gemini, и Claude.ai.
Во многом расходы на чипы, датацентры и АЭС обнулились.

0

Работодатель и EU правительство не дали AI тулов. $20 не лишние.
DeepSeek работает неплохо. Для ресерчей сгодится.
А DeepSeek на конфиденциальных данных отобьётся.

1

В некоторых странах ChatGPT недоступно, DeepSeek там будет the game changer.

Пользователь отредактировал комментарий 28 января 2025, 12:45

-1

Вот это самое важное отличие имхо. Пока США и Европа играются в санкции, Китай дружит со всеми и наращивает юзерскую базу х2.

hottaby422
hottaby422 Консультант в Сам себе буратино
-2

Ой, ну ребята)) ну совсем же уши торчат))