🚀 Идем на ежегодный Cloud Security TechSpot в Варшаве
Support us

Разработчики создали за $50 ИИ-модель, конкурирующую с OpenAI

Исследователи из Стэнфорда и Вашингтонского университета разработали модель искусственного интеллекта s1, способную к рассуждению, всего за $50. Эта модель, как утверждается, конкурирует с ведущими моделями, такими как o1 от OpenAI и R1 от DeepSeek, в тестах на математические и программные навыки.

6 комментариев
Разработчики создали за $50 ИИ-модель, конкурирующую с OpenAI

Исследователи из Стэнфорда и Вашингтонского университета разработали модель искусственного интеллекта s1, способную к рассуждению, всего за $50. Эта модель, как утверждается, конкурирует с ведущими моделями, такими как o1 от OpenAI и R1 от DeepSeek, в тестах на математические и программные навыки.

Команда, разработавшая s1, использовала готовую базовую модель и доработала ее с помощью дистилляции, процесса, который извлекает способности к рассуждению из другой ИИ-модели путем обучения на ее ответах. Модель s1 была дистиллирована из Gemini 2.0 Flash Thinking Experimental от Google, этот же метод использовали исследователи из Беркли для создания аналогичной модели за $450 в прошлом месяце.

Для обучения s1 был создан набор данных всего из 1000 вопросов и ответов с обоснованиями, полученными от Gemini. Обучение заняло менее 30 минут с использованием 16 графических процессоров Nvidia H100, а общая стоимость составила менее $50. По словам Никласа Мюннигхоффа, исследователя из Стэнфорда, участвовавшего в проекте, необходимую вычислительную мощность можно арендовать примерно за $20.

Этот прорыв вызывает вопросы о коммерциализации ИИ-моделей. Если небольшие группы могут воспроизвести дорогие модели с минимальными инвестициями, это ставит под сомнение концепцию патентованного преимущества в индустрии ИИ. OpenAI, например, обвинила DeepSeek в неправомерном сборе данных из своего API для целей дистилляции.

Модель s1 показывает, что модели рассуждения можно дистиллировать с использованием относительно небольшого набора данных посредством контролируемой тонкой настройки (SFT). Этот подход является более экономичным методом по сравнению с крупномасштабным обучением с подкреплением. SFT позволяет ИИ-моделям имитировать определенное поведение в наборе данных, достигая высокой производительности рассуждений с меньшими затратами.

Тем не менее, эксперты утверждают, что, хотя методы дистилляции могут воспроизводить существующие модели, они не обязательно приведут к прорывным достижениям в производительности ИИ. Крупные ИИ-компании, такие как Meta, Google и Microsoft, планируют инвестировать миллиарды в инфраструктуру ИИ, но s1 демонстрирует, как небольшие инновации расширяют границы возможностей ИИ. Модель s1, а также данные и код для ее обучения, теперь доступны на GitHub.

Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
По теме
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
Alphabet потратит на ИИ $75 млрд в этом году
Alphabet потратит на ИИ $75 млрд в этом году
По теме
Alphabet потратит на ИИ $75 млрд в этом году
Google отказалась от обещания не использовать ИИ в военных целях
Google отказалась от обещания не использовать ИИ в военных целях
По теме
Google отказалась от обещания не использовать ИИ в военных целях
Читайте также
ByteDance представила ИИ, который превращает любое фото в 3D
ByteDance представила ИИ, который превращает любое фото в 3D
ByteDance представила ИИ, который превращает любое фото в 3D
Теперь Gemini делает презентации сама — по тексту или загруженному файлу
Теперь Gemini делает презентации сама — по тексту или загруженному файлу
Теперь Gemini делает презентации сама — по тексту или загруженному файлу
ИИ помогает работникам подделывать чеки, которые невозможно отличить от настоящих
ИИ помогает работникам подделывать чеки, которые невозможно отличить от настоящих
ИИ помогает работникам подделывать чеки, которые невозможно отличить от настоящих
Более 1 млн пользователей обсуждают c ChatGPT суицид — в неделю
Более 1 млн пользователей обсуждают c ChatGPT суицид — в неделю
Более 1 млн пользователей обсуждают c ChatGPT суицид — в неделю

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

povelitel-krasnogo-drakona
povelitel-krasnogo-drakona Проектный мессенджер в 我想排便
2

Исследователи из Стэнфорда и Вашингтонского университета

Срочно запретить:
- исследовать
- университеты

Пользователь отредактировал комментарий 6 февраля 2025, 15:45

fabulius 91
fabulius 91 CEO в Предприниматель в Польше
1

Следующая статья как баба Маша в банке огурцов создала аналоговый AGI?

fabulius 91
fabulius 91 CEO в Предприниматель в Польше
1

Многие уже уловили эту комбину с раcкрученным T9.

1

а так все начиналось

Яна Пильник
Яна Пильник Дрессировщик программистов в EPAM
0

И запустила на нём Doom

table
table Table в Database
2

скоро на собесе: если не будет своей ии модели - можно не приходить