Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами! Это просто и ничего не стоит
Support us

Разработчики создали за $50 ИИ-модель, конкурирующую с OpenAI

Исследователи из Стэнфорда и Вашингтонского университета разработали модель искусственного интеллекта s1, способную к рассуждению, всего за $50. Эта модель, как утверждается, конкурирует с ведущими моделями, такими как o1 от OpenAI и R1 от DeepSeek, в тестах на математические и программные навыки.

6 комментариев
Разработчики создали за $50 ИИ-модель, конкурирующую с OpenAI

Исследователи из Стэнфорда и Вашингтонского университета разработали модель искусственного интеллекта s1, способную к рассуждению, всего за $50. Эта модель, как утверждается, конкурирует с ведущими моделями, такими как o1 от OpenAI и R1 от DeepSeek, в тестах на математические и программные навыки.

Команда, разработавшая s1, использовала готовую базовую модель и доработала ее с помощью дистилляции, процесса, который извлекает способности к рассуждению из другой ИИ-модели путем обучения на ее ответах. Модель s1 была дистиллирована из Gemini 2.0 Flash Thinking Experimental от Google, этот же метод использовали исследователи из Беркли для создания аналогичной модели за $450 в прошлом месяце.

Для обучения s1 был создан набор данных всего из 1000 вопросов и ответов с обоснованиями, полученными от Gemini. Обучение заняло менее 30 минут с использованием 16 графических процессоров Nvidia H100, а общая стоимость составила менее $50. По словам Никласа Мюннигхоффа, исследователя из Стэнфорда, участвовавшего в проекте, необходимую вычислительную мощность можно арендовать примерно за $20.

Этот прорыв вызывает вопросы о коммерциализации ИИ-моделей. Если небольшие группы могут воспроизвести дорогие модели с минимальными инвестициями, это ставит под сомнение концепцию патентованного преимущества в индустрии ИИ. OpenAI, например, обвинила DeepSeek в неправомерном сборе данных из своего API для целей дистилляции.

Модель s1 показывает, что модели рассуждения можно дистиллировать с использованием относительно небольшого набора данных посредством контролируемой тонкой настройки (SFT). Этот подход является более экономичным методом по сравнению с крупномасштабным обучением с подкреплением. SFT позволяет ИИ-моделям имитировать определенное поведение в наборе данных, достигая высокой производительности рассуждений с меньшими затратами.

Тем не менее, эксперты утверждают, что, хотя методы дистилляции могут воспроизводить существующие модели, они не обязательно приведут к прорывным достижениям в производительности ИИ. Крупные ИИ-компании, такие как Meta, Google и Microsoft, планируют инвестировать миллиарды в инфраструктуру ИИ, но s1 демонстрирует, как небольшие инновации расширяют границы возможностей ИИ. Модель s1, а также данные и код для ее обучения, теперь доступны на GitHub.

Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
По теме
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
Alphabet потратит на ИИ $75 млрд в этом году
Alphabet потратит на ИИ $75 млрд в этом году
По теме
Alphabet потратит на ИИ $75 млрд в этом году
Google отказалась от обещания не использовать ИИ в военных целях
Google отказалась от обещания не использовать ИИ в военных целях
По теме
Google отказалась от обещания не использовать ИИ в военных целях
Читатели в 🇵🇱, пожалуйста, поддержите dev.by своими налогами!

Это просто и ничего не стоит

Читайте также
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Нейросеть «оживляет» классические пиксельные игры
Думскроллинг вредит психике и физическому здоровью пользователей
Думскроллинг вредит психике и физическому здоровью пользователей
Думскроллинг вредит психике и физическому здоровью пользователей
3 комментария
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Meta разработала ИИ для «чтения мыслей»
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
Во Франции искусственный интеллект помогает искать нелегальные бассейны и штрафовать нарушителей
4 комментария

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

povelitel-krasnogo-drakona
povelitel-krasnogo-drakona Проектный мессенджер в 我想排便
2

Исследователи из Стэнфорда и Вашингтонского университета

Срочно запретить:
- исследовать
- университеты

Пользователь отредактировал комментарий 6 февраля 2025, 15:45

fabulius 91
fabulius 91 CEO в Предприниматель в Польше
1

Следующая статья как баба Маша в банке огурцов создала аналоговый AGI?

fabulius 91
fabulius 91 CEO в Предприниматель в Польше
1

Многие уже уловили эту комбину с раcкрученным T9.

1

а так все начиналось

Lars Ulrich
Lars Ulrich MENA\GCC Representative в EPAM
0

И запустила на нём Doom

table
table Table в Database
2

скоро на собесе: если не будет своей ии модели - можно не приходить