Айцішнік напісаў першы беларускамоўны посткіберпанк-раман. Пра што?
Support us

Разработчики создали за $50 ИИ-модель, конкурирующую с OpenAI

Исследователи из Стэнфорда и Вашингтонского университета разработали модель искусственного интеллекта s1, способную к рассуждению, всего за $50. Эта модель, как утверждается, конкурирует с ведущими моделями, такими как o1 от OpenAI и R1 от DeepSeek, в тестах на математические и программные навыки.

6 комментариев
Разработчики создали за $50 ИИ-модель, конкурирующую с OpenAI

Исследователи из Стэнфорда и Вашингтонского университета разработали модель искусственного интеллекта s1, способную к рассуждению, всего за $50. Эта модель, как утверждается, конкурирует с ведущими моделями, такими как o1 от OpenAI и R1 от DeepSeek, в тестах на математические и программные навыки.

Команда, разработавшая s1, использовала готовую базовую модель и доработала ее с помощью дистилляции, процесса, который извлекает способности к рассуждению из другой ИИ-модели путем обучения на ее ответах. Модель s1 была дистиллирована из Gemini 2.0 Flash Thinking Experimental от Google, этот же метод использовали исследователи из Беркли для создания аналогичной модели за $450 в прошлом месяце.

Для обучения s1 был создан набор данных всего из 1000 вопросов и ответов с обоснованиями, полученными от Gemini. Обучение заняло менее 30 минут с использованием 16 графических процессоров Nvidia H100, а общая стоимость составила менее $50. По словам Никласа Мюннигхоффа, исследователя из Стэнфорда, участвовавшего в проекте, необходимую вычислительную мощность можно арендовать примерно за $20.

Этот прорыв вызывает вопросы о коммерциализации ИИ-моделей. Если небольшие группы могут воспроизвести дорогие модели с минимальными инвестициями, это ставит под сомнение концепцию патентованного преимущества в индустрии ИИ. OpenAI, например, обвинила DeepSeek в неправомерном сборе данных из своего API для целей дистилляции.

Модель s1 показывает, что модели рассуждения можно дистиллировать с использованием относительно небольшого набора данных посредством контролируемой тонкой настройки (SFT). Этот подход является более экономичным методом по сравнению с крупномасштабным обучением с подкреплением. SFT позволяет ИИ-моделям имитировать определенное поведение в наборе данных, достигая высокой производительности рассуждений с меньшими затратами.

Тем не менее, эксперты утверждают, что, хотя методы дистилляции могут воспроизводить существующие модели, они не обязательно приведут к прорывным достижениям в производительности ИИ. Крупные ИИ-компании, такие как Meta, Google и Microsoft, планируют инвестировать миллиарды в инфраструктуру ИИ, но s1 демонстрирует, как небольшие инновации расширяют границы возможностей ИИ. Модель s1, а также данные и код для ее обучения, теперь доступны на GitHub.

Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
По теме
Китайский стартап DeepSeek хакнул ИИ-рынок в США: дешевый конкурент «порвал» ChatGPT за один день
Alphabet потратит на ИИ $75 млрд в этом году
Alphabet потратит на ИИ $75 млрд в этом году
По теме
Alphabet потратит на ИИ $75 млрд в этом году
Google отказалась от обещания не использовать ИИ в военных целях
Google отказалась от обещания не использовать ИИ в военных целях
По теме
Google отказалась от обещания не использовать ИИ в военных целях
Читайте также
«Это только начало»: бывший хакер раскрыл три ИИ-схемы мошенников
«Это только начало»: бывший хакер раскрыл три ИИ-схемы мошенников
«Это только начало»: бывший хакер раскрыл три ИИ-схемы мошенников
Три года с ChatGPT. Как исскуственный интеллект стал моим стилистом, терапевтом и преподавателем
Три года с ChatGPT. Как исскуственный интеллект стал моим стилистом, терапевтом и преподавателем
Три года с ChatGPT. Как исскуственный интеллект стал моим стилистом, терапевтом и преподавателем
Вот уже три года я каждый день общаюсь с ChatGPT. Он стал незаменимым помощником в изучении языка и даже помог сформировать собственный стиль в одежде. Кажется, из бездушного робота превратился в близкого спутника. В этой колонке я делюсь своим опытом использования ChatGPT в повседневных задачах и рассказываю, как искусственный интеллект помогает мне экономить время и энергию.
Академия наук хочет финансирование по модели стартапов. Лукашенко не против — слышит «много болтовни» про венчур
Академия наук хочет финансирование по модели стартапов. Лукашенко не против — слышит «много болтовни» про венчур
Академия наук хочет финансирование по модели стартапов. Лукашенко не против — слышит «много болтовни» про венчур
2 комментария
Вы напугали OpenAI: Альтман сказал сотрудникам, что свежие релизы Google могут создать проблемы для стартапа
Вы напугали OpenAI: Альтман сказал сотрудникам, что свежие релизы Google могут создать проблемы для стартапа
Вы напугали OpenAI: Альтман сказал сотрудникам, что свежие релизы Google могут создать проблемы для стартапа

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

povelitel-krasnogo-drakona
povelitel-krasnogo-drakona Проектный мессенджер в 我想排便
2

Исследователи из Стэнфорда и Вашингтонского университета

Срочно запретить:
- исследовать
- университеты

Пользователь отредактировал комментарий 6 февраля 2025, 15:45

fabulius 91
fabulius 91 CEO в Предприниматель в Польше
1

Следующая статья как баба Маша в банке огурцов создала аналоговый AGI?

fabulius 91
fabulius 91 CEO в Предприниматель в Польше
1

Многие уже уловили эту комбину с раcкрученным T9.

1

а так все начиналось

Яна Пильник
Яна Пильник Дрессировщик программистов в EPAM
0

И запустила на нём Doom

table
table Table в Database
2

скоро на собесе: если не будет своей ии модели - можно не приходить