DeepSeek ускоряет разработку модели R2, чтобы обогнать OpenAI
Китайский стартап ускорил разработку своей новой рассуждающей ИИ-модели R2, которая должна стать конкурентом GPT-5. Ранее OpenAI обвинила DeepSeek в том, что R1 обучалась на данных моделей компании.
По данным Reuters, DeepSeek первоначально планировала выпуск R2 в начале мая этого года, но теперь компания стремится выпустить ее как можно скорее. Новая модель, как ожидается, будет создавать более качественный программный код и рассуждать не только на английском, но и на других языках.
Выход R2 может вызвать обеспокоенность у правительства США, которое считает лидерство в области ИИ национальным приоритетом. В то же время, китайские власти и компании активно интегрируют модели DeepSeek в свои продукты, включая Lenovo, Baidu и Tencent.
Успех DeepSeek с моделью R1, которая была обучена на менее мощных ускорителях Nvidia, но смогла конкурировать с моделями, разработанными американскими технологическими гигантами за огромные суммы, вызвал широкий резонанс. Аналитики Bernstein brokerage оценили, что цены DeepSeek были в 20–40 раз дешевле, чем у OpenAI для эквивалентных моделей.
Несмотря на успехи, DeepSeek сталкивается с проблемами, в том числе с эмбарго на высокопроизводительные чипы. Конкуренты компании также пересмотрели свои стратегии. По данным СМИ, в свою очередь OpenAI ускорила разработку новой модели GPT-5, которая должна прийти на смену GPT-4.5
Читать на dev.by