🇵🇱 Дедлайн по e-PIT всё ближе ⏳ Поддержите devby из уже уплаченных налогов 💙
Support us

ИИ-моделям больше нравится работать с iOS, чем с Android. Даже моделям Google

Если раньше поиском багов в сломавшемся приложении и их исправлением разработчикам приходилось заниматься вручную, то теперь к процессу можно подключить искусственный интеллект. В компании Instabug обнаружили, что у ИИ есть предпочтения: модели лучше справляются с этой задачей на мобильной платформе Apple, чем Google.

Оставить комментарий
ИИ-моделям больше нравится работать с iOS, чем с Android. Даже моделям Google

Если раньше поиском багов в сломавшемся приложении и их исправлением разработчикам приходилось заниматься вручную, то теперь к процессу можно подключить искусственный интеллект. В компании Instabug обнаружили, что у ИИ есть предпочтения: модели лучше справляются с этой задачей на мобильной платформе Apple, чем Google.

В Instabug сделали инструмент SmartResolve на базе ведущих ИИ-моделей для автоматизации обнаружения сбоев приложений, диагностики неполадок и генерации исправлений кода. В деле — модели OpenAI, Anthropic, Google и Meta, которых проверили на датасете с реальными сбоями приложений. Каждое исправление оценивали на предмет корректности, схожести с исправлениями, предложенными живыми специалистами, глубины анализа причин, релевантности и общей адекватности.

Модели стабильно показывали более высокие результаты на iOS, чем на Android: практически у всех испытуемых ответы на платформе Apple были более точными, связными и структурированными.

Например, GPT-4o сработала на iOS на 60% против 49% — на Android. В случае o1 разрыв был ещё сильнее: 62% против 26%, причём зачастую в тестах на Android эта модель OpenAI вообще отказывалась отвечать.

Claude Sonnet 3.5 V1 от Anthropic набрала 58% на iOS и 56% — на Android. Даже Gemini 1.5 Pro оказалась хуже на платформе своей разработчицы: 59% на iOS против 51% — на Android.

Причину разбежки авторы доклада подозревают в неоднородности экосистемы Android. В отличие от iOS, она используется на гораздо более широком круге устройств, и самых разных видов сбоев здесь случается больше. ИИ-моделям, видимо, сложно генерализировать исправления. Кроме того, лучшие показатели на iOS частично связывают со структурой её нативных языков — Swift и Objective-C. Их синтаксис более предсказуем и сильно типизирован, поэтому моделям проще создавать точные исправления.

Microsoft: через 5 лет 95% кода будет писать ИИ
Microsoft: через 5 лет 95% кода будет писать ИИ 
По теме
Microsoft: через 5 лет 95% кода будет писать ИИ
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
По теме
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников которые не дружат с ИИ
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников, которые не дружат с ИИ 
По теме
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников, которые не дружат с ИИ
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
Anthropic показала мощный ИИ для поиска уязвимостей, но держит его закрытым
Anthropic показала мощный ИИ для поиска уязвимостей, но держит его закрытым
Anthropic показала мощный ИИ для поиска уязвимостей, но держит его закрытым
Вирусный ИИ-стартап заподозрили в мошенничестве из-за нейрослопа
Вирусный ИИ-стартап заподозрили в мошенничестве из-за нейрослопа
Вирусный ИИ-стартап заподозрили в мошенничестве из-за нейрослопа
«Я снова не сплю по ночам»: фаундер стартапа ушёл жить в горы — но ИИ настиг его и там
«Я снова не сплю по ночам»: фаундер стартапа ушёл жить в горы — но ИИ настиг его и там
«Я снова не сплю по ночам»: фаундер стартапа ушёл жить в горы — но ИИ настиг его и там
«Фабрика разработки сломалась»: компании тонут в потоке ИИ-кода
«Фабрика разработки сломалась»: компании тонут в потоке ИИ-кода
«Фабрика разработки сломалась»: компании тонут в потоке ИИ-кода

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.