Отдел новостей 21 августа 2024, 12:08

GPT-4o теперь можно дообучать на своих наборах данных

OpenAI разрешила сторонним разработчикам дообучать модель GPT-4o на своих наборах данных, заметил vc.ru. Благодаря этому можно, например, добиться особой структуры или стиля ответов.

1 комментарий

OpenAI разрешила сторонним разработчикам дообучать модель GPT-4o на своих наборах данных, заметил vc.ru. Благодаря этому можно, например, добиться особой структуры или стиля ответов.

В качестве примера приводится ситуация, в которой производитель скейтбордов дообучает модель для чат-бота, куда скейтеры обращаются с вопросами о хранении и ремонте «досок». В OpenAI отметили, что чтобы увидеть разницу, достаточно добавить в обучающий датасет всего «несколько десятков примеров».

Дообучение доступно всем разработчикам с платной подпиской. В соответствующем разделе нужно нажать на кнопку «Создать» и выбрать gpt-4o-06.08.2024 в выпадающем меню с базовыми моделями. Как устроен файнтюнинг, описано в справочном разделе.

Пока можно загрузить только текстовые данные — изображения и другие виды контента не поддерживаются. На дообучение в среднем уходит до двух часов.

OpenAI представила модель GPT-4o — она «умнее» предыдущей и доступна бесплатно

По словам OpenAI, «контроль» над дообученными моделями будет исключительно у самих разработчиков. Компания не будет использовать запросы, ответы и прочие «бизнес-данные» для тренировки ИИ или передавать третьим лицам.

Дообучение обойдётся в $25 за 1 млн токенов (до 23 сентября 2024 года организациям полагается по 1 млн токенов в день бесплатно). При использовании дообученной модели 1 млн «входных» токенов будет стоить $3,75, а «выходных» — $15.