Alibaba выпустила опенсорсную «мыслящую» модель — конкурента o1 от OpenAI
Alibaba представила ИИ-модель с открытым исходным кодом QwQ-32B-Preview, которая способна рассуждать, пишет TechCrunch.
Модель насчитывает 32,5 млрд параметров и может обрабатывать запросы длиной примерно до 32 тысяч слов. QwQ-32B-Preview умеет решать логические и математические задания, но разработчики признают, что она не идеальна — например, она может внезапно перескакивать с одного языка на другой, зацикливаться и недостаточно хорошо справляться с заданиями, которые предполагают рассуждение на основе здравого смысла.
Alibaba утверждает, что её разработка превосходит o1-preview и o1-mini — две «рассуждающие» модели, которые к настоящему времени выпустила OpenAI — на двух бенчмарках. Это AIME, который используется для измерения производительности моделей при помощи других ИИ-моделей, и MATH, который содержит текстовые математические задачи.
Модель распространяется по лицензии Apache 2.0 и может использоваться в коммерческих целях. Она доступна для работы и скачивания на платформе ИИ-разработки Hugging Face. Разработчики выложили лишь часть компонентов QwQ-32B-Preview, что не позволит полностью воссоздать её и узнать, как она устроена изнутри.
Как отмечает издание, модели китайского происхождения проходят проверку местных регуляторов — их ответы должны соответствовать «ключевым ценностям социализма». Многие китайские модели отказываются отвечать на вопросы, которые могут вызвать гнев властей — например, на тему режима Си Цзиньпина.
Читать на dev.by