Support us

ИИ-моделям больше нравится работать с iOS, чем с Android. Даже моделям Google

Если раньше поиском багов в сломавшемся приложении и их исправлением разработчикам приходилось заниматься вручную, то теперь к процессу можно подключить искусственный интеллект. В компании Instabug обнаружили, что у ИИ есть предпочтения: модели лучше справляются с этой задачей на мобильной платформе Apple, чем Google.

Оставить комментарий
ИИ-моделям больше нравится работать с iOS, чем с Android. Даже моделям Google

Если раньше поиском багов в сломавшемся приложении и их исправлением разработчикам приходилось заниматься вручную, то теперь к процессу можно подключить искусственный интеллект. В компании Instabug обнаружили, что у ИИ есть предпочтения: модели лучше справляются с этой задачей на мобильной платформе Apple, чем Google.

В Instabug сделали инструмент SmartResolve на базе ведущих ИИ-моделей для автоматизации обнаружения сбоев приложений, диагностики неполадок и генерации исправлений кода. В деле — модели OpenAI, Anthropic, Google и Meta, которых проверили на датасете с реальными сбоями приложений. Каждое исправление оценивали на предмет корректности, схожести с исправлениями, предложенными живыми специалистами, глубины анализа причин, релевантности и общей адекватности.

Модели стабильно показывали более высокие результаты на iOS, чем на Android: практически у всех испытуемых ответы на платформе Apple были более точными, связными и структурированными.

Например, GPT-4o сработала на iOS на 60% против 49% — на Android. В случае o1 разрыв был ещё сильнее: 62% против 26%, причём зачастую в тестах на Android эта модель OpenAI вообще отказывалась отвечать.

Claude Sonnet 3.5 V1 от Anthropic набрала 58% на iOS и 56% — на Android. Даже Gemini 1.5 Pro оказалась хуже на платформе своей разработчицы: 59% на iOS против 51% — на Android.

Причину разбежки авторы доклада подозревают в неоднородности экосистемы Android. В отличие от iOS, она используется на гораздо более широком круге устройств, и самых разных видов сбоев здесь случается больше. ИИ-моделям, видимо, сложно генерализировать исправления. Кроме того, лучшие показатели на iOS частично связывают со структурой её нативных языков — Swift и Objective-C. Их синтаксис более предсказуем и сильно типизирован, поэтому моделям проще создавать точные исправления.

Microsoft: через 5 лет 95% кода будет писать ИИ
Microsoft: через 5 лет 95% кода будет писать ИИ 
По теме
Microsoft: через 5 лет 95% кода будет писать ИИ
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
По теме
Сам пиши свой код: ИИ-ассистент отказался помогать юзеру и сказал учить матчасть
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников которые не дружат с ИИ
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников, которые не дружат с ИИ 
По теме
ИИ-ассистенты для кодеров поднимают огромные инвестиции. А некоторые компании планируют не нанимать айтишников, которые не дружат с ИИ
Читайте также
Как победить OpenAI? Советы для стартапов от сооснователя компании
Как победить OpenAI? Советы для стартапов от сооснователя компании
Как победить OpenAI? Советы для стартапов от сооснователя компании
Google наконец-то разрешила менять адрес Gmail
Google наконец-то разрешила менять адрес Gmail
Google наконец-то разрешила менять адрес Gmail
«Крёстный отец ИИ» обманывает чат-ботов ради честных ответов
«Крёстный отец ИИ» обманывает чат-ботов ради честных ответов
«Крёстный отец ИИ» обманывает чат-ботов ради честных ответов
В Microsoft хотят перенести весь код с C/C++ на Rust за несколько лет
В Microsoft хотят перенести весь код с C/C++ на Rust за несколько лет
В Microsoft хотят перенести весь код с C/C++ на Rust за несколько лет

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.