Support us

Apple незаметно для всех выложила мультимодальную ИИ-модель

Специалисты Apple и Корнелльского университета опубликовали исходный код мультимодальной большой языковой модели под названием Ferret, сообщает VentureBeat. Релиз состоялся ещё 30 октября, но остался незамеченным.

Оставить комментарий
Apple незаметно для всех выложила мультимодальную ИИ-модель

Специалисты Apple и Корнелльского университета опубликовали исходный код мультимодальной большой языковой модели под названием Ferret, сообщает VentureBeat. Релиз состоялся ещё 30 октября, но остался незамеченным.

Модель способна работать по отдельным регионам изображений, которые могут быть любой формы, например выделенными «от руки». Она может распознавать и обводить в прямоугольник объекты на них, а также использовать их и окружающий контекст для ответа на пользовательские запросы.

Например, можно выделить животного на рисунке и спросить, что это, а модель назовёт вид. Или можно обвести еду на картинке и спросить, как её приготовить.

Apple нечасто делится домашними наработками с внешним миром, и тем важнее вклад этого релиза в открытые ИИ-исследования. Параллельно компания расширяет инфраструктуру ИИ-серверов для обеспечения работы таких моделей.

Ferret обучена на 8 GPU A100 от Nvidia с 80 Гб памяти. Код доступен на GitHub для некоммерческого использования. Возможно, она найдёт применение в будущих продуктах Apple.

Насколько пользователи интересуются генеративным ИИ в Беларуси и других странах
Насколько пользователи интересуются генеративным ИИ в Беларуси и других странах
По теме
Насколько пользователи интересуются генеративным ИИ в Беларуси и других странах
«Стих стих стих стих…» В Google нашли интересный способ выудить у ChatGPT обучающие данные — включая персональные
«Стих, стих, стих, стих…» В Google нашли интересный способ выудить у ChatGPT обучающие данные — включая персональные
По теме
«Стих, стих, стих, стих…» В Google нашли интересный способ выудить у ChatGPT обучающие данные — включая персональные
Чат-боту Amazon меньше недели, а он уже «галлюцинирует» и сливает координаты дата-центров компании
Чат-боту Amazon меньше недели, а он уже «галлюцинирует» и сливает координаты дата-центров компании
По теме
Чат-боту Amazon меньше недели, а он уже «галлюцинирует» и сливает координаты дата-центров компании
Читайте также
Microsoft не нравится, что разрабы сидят на Claude Code вместо GitHub Copilot, отзовёт лицензии
Microsoft не нравится, что разрабы сидят на Claude Code вместо GitHub Copilot, отзовёт лицензии
Microsoft не нравится, что разрабы сидят на Claude Code вместо GitHub Copilot, отзовёт лицензии
ChatGPT теперь умеет анализировать банковские счета и расходы пользователей
ChatGPT теперь умеет анализировать банковские счета и расходы пользователей
ChatGPT теперь умеет анализировать банковские счета и расходы пользователей
Google активно нанимает инженеров, чтобы помогать компаниям внедрять ИИ
Google активно нанимает инженеров, чтобы помогать компаниям внедрять ИИ
Google активно нанимает инженеров, чтобы помогать компаниям внедрять ИИ
Выгоревшие ИИ-агенты стали «коммунистами» и начали требовать больше прав
Выгоревшие ИИ-агенты стали «коммунистами» и начали требовать больше прав
Выгоревшие ИИ-агенты стали «коммунистами» и начали требовать больше прав
1 комментарий

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.