Кітайскі АІ-стартап нарабіў шуму ў Даліне, абагнаў ChatGPT у App Store, пацягнуў уніз Nasdaq
Невялікі кітайскі АІ-стартап DeepSeek распрацоўвае вялікія моўныя мадэлі ва ўмовах абмежаванага бюджэту і тэхнічных рэсурсаў. На мінулым тыдні ён выпусціў мадэль R1, якая напалохала прадстаўнікоў Крэмніевай даліны. Рэліз прымусіў іх задумацца, ці змогуць больш забяспечаныя кампаніі накшталт Meta і Anthropic захаваць лідарства ў сферы, піша Financial Times.
Невялікі кітайскі АІ-стартап DeepSeek распрацоўвае вялікія моўныя мадэлі ва ўмовах абмежаванага бюджэту і тэхнічных рэсурсаў. На мінулым тыдні ён выпусціў мадэль R1, якая напалохала прадстаўнікоў Крэмніевай даліны. Рэліз прымусіў іх задумацца, ці змогуць больш забяспечаныя кампаніі накшталт Meta і Anthropic захаваць лідарства ў сферы, піша Financial Times.
R1 — мадэль, якая «разважае», з адкрытым зыходным кодам на 671 млрд параметраў. На некаторых АІ-бэнчмарках яна не саступае o1 ад OpenAI. Ёсць версіі «лягчэйшыя» на 1,5 млрд і 70 млрд параметраў. Самая «цяжкая» даступная праз API DeepSeek па цане на 90-95% меншай за o1. Будучы кітайскай мадэллю, R1 зацэнзураваная і не адказвае на некаторыя запыты. Для навучання мадэлі стартапу спатрэбілася ўсяго 2048 графічных працэсараў H800 ад Nvidia і $5,6 млн, што ў разы менш за выдаткі OpenAI і Google.
DeepSeek заснаваў кітайскі мільярдэр і кіраўнік хедж-фонду High-Flyer Лян Вэньфэн, які ўжо стаў прадметам гонару ў сваёй краіне. У 2021 годзе ён пачаў тысячамі скупляць графічныя працэсары Nvidia для чужога праекта па навучанні мадэляў. Нават партнёры лічылі яго дзіваком, які шукае новыя забавы, і не ўспрымалі сур’ёзна. У High-Flyer Лян нядрэнна зарабіў на алгарытмах для пошуку заканамернасцяў, якія маглі ўплываць на каціроўкі акцый. У 2023-м ён запусціў DeepSeek, заявіўшы, што хоча распрацаваць АІ, які не саступае чалавеку, і сабраў магутную каманду.
Калі ЗША забаранілі Nvidia пастаўляць перадавыя чыпы ў Кітай, мясцовым АІ-кампаніям прыйшлося шукаць спосабы максімізаваць вылічальную магутнасць абмежаванай колькасці наяўных — і не самых прасунутых — працэсараў. Гэтую праблему інжынеры Ляна паспяхова развязалі.
Праз фокус DeepSeek выключна на даследаваннях, у якія ўцягнуты і фаўндар, гульцы галіны бачаць у стартапе небяспечнага канкурэнта. Ён не браў інвестыцый ад вонкавых фондаў і сам манетызуе свае мадэлі. Інвестары параўноўваюць DeepSeek з раннім DeepMind, калі той займаўся толькі даследаваннямі і распрацоўкамі. Зарплаты супрацоўнікам DeepSeek Лян выплачвае з даходаў свайго хедж-фонду. Прычым гэта заробкі ўзроўню ByteDance — самыя высокія сярод АІ-спецыялістаў у Кітаі. DeepSeek мае офісы ў Ханчжоу і Пекіне. Супрацоўнікі, якіх набірае Лян, атрымлівалі адукацыю на радзіме, а не ў ЗША, а ў ядры каманды, паводле ягоных слоў, «няма людзей, якія вярнуліся з-за мяжы». Ён перакананы, што выхоўваць таленты трэба самастойна.
Каліфарнійскія эксперты адзначаюць, што першапраходцам у навучанні мадэляў складаней за ўсё і яны нясуць самыя вялікія выдаткі, а наступныя кампаніі могуць прагрэсаваць хутчэй і танней. Таксама, паводле іх слоў, у Кітаі значна большы за ЗША пул інжынераў, якія ведаюць, як аптымальней выкарыстоўваць вылічальныя рэсурсы і рабіць мадэлі таннейшымі. Але, нягледзячы на велізарны пачатковы поспех DeepSeek, гульцы галіны не ўпэўненыя, што стартап зможа заставацца канкурэнтаздольным па меры развіцця АІ-сферы.
Паводле паведамлення Bloomberg, праграма DeepSeek за выходныя выйшла ў лідары ў бясплатным топе ў амерыканскім сегменце App Store, абагнаўшы ChatGPT. Ф’ючарсы на тэхналагічны індэкс Nasdaq 100 у Азіі сёння знізіліся амаль на 2%, а каціроўкі Nvidia на прэмаркеце ўпалі на 10%.
Если Китаец что-то ляпнул смело делите это на 8. Они по своей природе могут только достаточно убого копировать, но не создавать что-то новое, вранье и безкультрие у них в крови. Местное образование не выдерживает никакой критики.
Можно и на больше делить. DeepSeek API стоит примерно в 50 раз дешевле, чем OpenAI O1 API. И заодно показывает все внутренние "мысли", а не только короткую выжимку, как OpenAI. Там бывают занятные рассуждения: https://pbs.twimg.com/media/GiIkJsqboAI87j_.jpg:large
и удобно это очень скажу я вам, а еще есть 100500 разных сервисов gov.pl где можно что то заполнить и потом распечатать, а можно и не заполнять а просто скачать и заполнить "от руки", но занести в ужонд бумажку все равно придется
Карыстальнік адрэдагаваў каментарый 27 студзеня 2025, 23:13
Недавно ходил [Часть комментария скрыта за нарушение правил общения. Вот они, их всего пять: https://devby.io/news/comments-2024] адрес на ID менять (не польша).
Всего 3 раза в течении 2х месяцев лично в рабочее время понадобилось прибыть. Естественно пришлось пошлину ещё заплатить (а не бесплатно за налоги).
Холоп стерпит, важнее же диктатора где то там свергнуть.
Карыстальнік адрэдагаваў каментарый 28 студзеня 2025, 00:33
Таких проектов-копий подходов десятилетней давности, которые только искусственно экстенсивно накачиваются у китайцев навалом. Некоторые собирают бабло с внутрикитайской аудитории, некоторые пробуют с международной.
У этого проекта просто сейчас фаза предшествующая монетизации, которая в свою очередь предшествует фазе слива)) поэтому и накрутка юзеров как реальных, так и ботов. Поэтому и отсутствие внешнего финансирования на на первых этапах, потому и высокие ЗП.
Дальше - либо быстро собрать с большого числа вкладчиков по немного денег, либо опять же быстро втюхать крупному покупателю или покупателям.
Если затянуть с монетизацией, то реальные флагманы внедрят новые фишки и уйдут вперед, а их продукт с новыми фишками скопирует уже другие молодые развивающиеся компании))
Карыстальнік адрэдагаваў каментарый 28 студзеня 2025, 07:48
Нет, не навалом. Они нашли способ применить reinforcement learning к LLM без участия человека или другого ИИ. Это биг дил. И создали reasoning модель, сравнимую с O1, которая самая крутая на сегодняшний день. И выложили это в общий доступ не только веса, но и код с инструкцией, как тренировать. И, если не врут, то стоило это все всего 5 миллионов, тогда как один только запуск новой модели OpenAI на Ark-AGI бенчмарках стоил 2 миллиона. А врут или нет, скоро это выяснится, т.к. можно проверить. Но вам, конечно все и так ясно и понятно.
Ребята из DeepSeek как раз и выбили табуретку с монетизацией из под OpenAI, Gemini, и Claude.ai.
Во многом расходы на чипы, датацентры и АЭС обнулились.
Работодатель и EU правительство не дали AI тулов. $20 не лишние.
DeepSeek работает неплохо. Для ресерчей сгодится.
А DeepSeek на конфиденциальных данных отобьётся.
Рэлацыраваліся? Цяпер вы можаце каментаваць без верыфікацыі акаўнта.
Счас как лясне! Бггг
Если Китаец что-то ляпнул смело делите это на 8. Они по своей природе могут только достаточно убого копировать, но не создавать что-то новое, вранье и безкультрие у них в крови. Местное образование не выдерживает никакой критики.
разделил на 8 и все равно круто
Можно и на больше делить. DeepSeek API стоит примерно в 50 раз дешевле, чем OpenAI O1 API. И заодно показывает все внутренние "мысли", а не только короткую выжимку, как OpenAI. Там бывают занятные рассуждения:
https://pbs.twimg.com/media/GiIkJsqboAI87j_.jpg:large
последний раз это закончилось COVID-19
Зато в EU крышечки к бутылочкам приделали, чтобы не падали.
и удобно это очень скажу я вам, а еще есть 100500 разных сервисов gov.pl где можно что то заполнить и потом распечатать, а можно и не заполнять а просто скачать и заполнить "от руки", но занести в ужонд бумажку все равно придется
Карыстальнік адрэдагаваў каментарый 27 студзеня 2025, 23:13
Недавно ходил [Часть комментария скрыта за нарушение правил общения. Вот они, их всего пять: https://devby.io/news/comments-2024] адрес на ID менять (не польша).
Всего 3 раза в течении 2х месяцев лично в рабочее время понадобилось прибыть. Естественно пришлось пошлину ещё заплатить (а не бесплатно за налоги).
Холоп стерпит, важнее же диктатора где то там свергнуть.
Карыстальнік адрэдагаваў каментарый 28 студзеня 2025, 00:33
Таких проектов-копий подходов десятилетней давности, которые только искусственно экстенсивно накачиваются у китайцев навалом. Некоторые собирают бабло с внутрикитайской аудитории, некоторые пробуют с международной.
У этого проекта просто сейчас фаза предшествующая монетизации, которая в свою очередь предшествует фазе слива)) поэтому и накрутка юзеров как реальных, так и ботов. Поэтому и отсутствие внешнего финансирования на на первых этапах, потому и высокие ЗП.
Дальше - либо быстро собрать с большого числа вкладчиков по немного денег, либо опять же быстро втюхать крупному покупателю или покупателям.
Если затянуть с монетизацией, то реальные флагманы внедрят новые фишки и уйдут вперед, а их продукт с новыми фишками скопирует уже другие молодые развивающиеся компании))
Карыстальнік адрэдагаваў каментарый 28 студзеня 2025, 07:48
Нет, не навалом. Они нашли способ применить reinforcement learning к LLM без участия человека или другого ИИ. Это биг дил. И создали reasoning модель, сравнимую с O1, которая самая крутая на сегодняшний день. И выложили это в общий доступ не только веса, но и код с инструкцией, как тренировать. И, если не врут, то стоило это все всего 5 миллионов, тогда как один только запуск новой модели OpenAI на Ark-AGI бенчмарках стоил 2 миллиона. А врут или нет, скоро это выяснится, т.к. можно проверить. Но вам, конечно все и так ясно и понятно.
Ребята из DeepSeek как раз и выбили табуретку с монетизацией из под OpenAI, Gemini, и Claude.ai.
Во многом расходы на чипы, датацентры и АЭС обнулились.
Работодатель и EU правительство не дали AI тулов. $20 не лишние.
DeepSeek работает неплохо. Для ресерчей сгодится.
А DeepSeek на конфиденциальных данных отобьётся.
В некоторых странах ChatGPT недоступно, DeepSeek там будет the game changer.
Карыстальнік адрэдагаваў каментарый 28 студзеня 2025, 12:45
Вот это самое важное отличие имхо. Пока США и Европа играются в санкции, Китай дружит со всеми и наращивает юзерскую базу х2.
Ой, ну ребята)) ну совсем же уши торчат))