devby 17 лет! Вспоминаем переходный возраст и делимся виш-листом
Support us

ИИ-моделям больше нравится работать с iOS, чем с Android. Даже моделям Google

Если раньше поиском багов в сломавшемся приложении и их исправлением разработчикам приходилось заниматься вручную, то теперь к процессу можно подключить искусственный интеллект. В компании Instabug обнаружили, что у ИИ есть предпочтения: модели лучше справляются с этой задачей на мобильной платформе Apple, чем Google.

Оставить комментарий
ИИ-моделям больше нравится работать с iOS, чем с Android. Даже моделям Google

Если раньше поиском багов в сломавшемся приложении и их исправлением разработчикам приходилось заниматься вручную, то теперь к процессу можно подключить искусственный интеллект. В компании Instabug обнаружили, что у ИИ есть предпочтения: модели лучше справляются с этой задачей на мобильной платформе Apple, чем Google.

В Instabug сделали инструмент SmartResolve на базе ведущих ИИ-моделей для автоматизации обнаружения сбоев приложений, диагностики неполадок и генерации исправлений кода. В деле — модели OpenAI, Anthropic, Google и Meta, которых проверили на датасете с реальными сбоями приложений. Каждое исправление оценивали на предмет корректности, схожести с исправлениями, предложенными живыми специалистами, глубины анализа причин, релевантности и общей адекватности.

Модели стабильно показывали более высокие результаты на iOS, чем на Android: практически у всех испытуемых ответы на платформе Apple были более точными, связными и структурированными.

Например, GPT-4o сработала на iOS на 60% против 49% — на Android. В случае o1 разрыв был ещё сильнее: 62% против 26%, причём зачастую в тестах на Android эта модель OpenAI вообще отказывалась отвечать.

Claude Sonnet 3.5 V1 от Anthropic набрала 58% на iOS и 56% — на Android. Даже Gemini 1.5 Pro оказалась хуже на платформе своей разработчицы: 59% на iOS против 51% — на Android.

Причину разбежки авторы доклада подозревают в неоднородности экосистемы Android. В отличие от iOS, она используется на гораздо более широком круге устройств, и самых разных видов сбоев здесь случается больше. ИИ-моделям, видимо, сложно генерализировать исправления. Кроме того, лучшие показатели на iOS частично связывают со структурой её нативных языков — Swift и Objective-C. Их синтаксис более предсказуем и сильно типизирован, поэтому моделям проще создавать точные исправления.

Microsoft: через 5 лет 95% кода будет писать ИИ
Microsoft: через 5 лет 95% кода будет писать ИИ 
По теме
Microsoft: через 5 лет 95% кода будет писать ИИ
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
По теме
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников которые не дружат с ИИ
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников, которые не дружат с ИИ 
По теме
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников, которые не дружат с ИИ
Читайте также
«Мы живём в 1999-м»: инвесторы выбирают тактику эпохи доткомов на рынке ИИ
«Мы живём в 1999-м»: инвесторы выбирают тактику эпохи доткомов на рынке ИИ
«Мы живём в 1999-м»: инвесторы выбирают тактику эпохи доткомов на рынке ИИ
1 комментарий
В Instagram появился генератор фото для сториз
В Instagram появился генератор фото для сториз
В Instagram появился генератор фото для сториз
ИИ оставляет без работы своих же разработчиков
ИИ оставляет без работы своих же разработчиков
ИИ оставляет без работы своих же разработчиков
Власти США впервые запросили у OpenAI промпты пользователя ChatGPT
Власти США впервые запросили у OpenAI промпты пользователя ChatGPT
Власти США впервые запросили у OpenAI промпты пользователя ChatGPT

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.