CTO SOFTSWISS — зачем он собирает Tech Race Summit в Варшаве
Support us

ИИ хуже людей резюмирует информацию — по всем параметрам

Искусственный интеллект хуже людей резюмирует документы и, скорее, даже создаёт им дополнительную работу. К такому выводу пришла Amazon по итогам экспериментов, заказанных Австралийской комиссией по ценным бумагам и инвестициям (ASIC).

Оставить комментарий
ИИ хуже людей резюмирует информацию — по всем параметрам

Искусственный интеллект хуже людей резюмирует документы и, скорее, даже создаёт им дополнительную работу. К такому выводу пришла Amazon по итогам экспериментов, заказанных Австралийской комиссией по ценным бумагам и инвестициям (ASIC).

Исследователи тестировали разные генеративные ИИ-модели, из которых выбрали одну самую многообещающую — опенсорсную Llama2-70B от Meta. Ей скормили тексты пяти ответов на парламентский запрос к аудиторским и консалтинговым фирмам, которые модель должна была резюмировать с фокусом на упоминания ASIC, рекомендации и прочее, а также указать страницы и контекст.

То же задание поручили десяти сотрудникам ASIC разного ранга. Далее работы модели и людей дали группе рецензентов на «слепую» проверку по таким параметрам, как связность, длина, а также тем по тем пунктам, на которых нужно было сфокусироваться в резюме. О том, что в исследовании участвует ИИ, они не знали.

Работы живых сотрудников оказались качественнее работ ИИ по всем критериям во всех пяти случаях: 81% против 47%. Человеческие резюме значительно опережали ИИ в плане поиска ссылок на документы ASIC в длинном тексте. В машинных резюме часто было упущено основное, детали и контекст, акцент мог делаться на второстепенных деталях, могла добавляться некорректная информация, отсутствовала релевантная и присутствовала — нерелевантная информация.

В целом рецензенты посчитали, что ИИ-резюме могут быть контрпродуктивны и создавать ненужную работу, потому что их нужно перепроверять и сверять с оригинальными текстами. При этом отмечается, что у новой версии модели способность резюмировать тексты может быть уже лучше, а также что Amazon повысила производительность испытуемой модели путём кастомизации промптов, а это означает наличие пространства для дальнейших улучшений.

GitHub: 97% разработчиков используют ИИ
GitHub: 97% разработчиков используют ИИ 
По теме
GitHub: 97% разработчиков используют ИИ
Klarna заменил маркетологов на ИИ, а теперь хочет убрать половину штата
Klarna заменил маркетологов на ИИ, а теперь хочет убрать половину штата
По теме
Klarna заменил маркетологов на ИИ, а теперь хочет убрать половину штата
Читайте также
Апокалипсис на рынке труда отменяется: спрос на ИТ-специалистов снова растёт
Апокалипсис на рынке труда отменяется: спрос на ИТ-специалистов снова растёт
Апокалипсис на рынке труда отменяется: спрос на ИТ-специалистов снова растёт
ИИ-слоп становится базой: 60% видео для новых пользователей TikTok сгенерированы нейросетями
ИИ-слоп становится базой: 60% видео для новых пользователей TikTok сгенерированы нейросетями
ИИ-слоп становится базой: 60% видео для новых пользователей TikTok сгенерированы нейросетями
Почти все компании сталкиваются с ИИ-инцидентами, но политики есть только у трети
Почти все компании сталкиваются с ИИ-инцидентами, но политики есть только у трети
Почти все компании сталкиваются с ИИ-инцидентами, но политики есть только у трети
Первые трещины в поиске Google: пользователи уходят в чат-боты и поиск без ИИ
Первые трещины в поиске Google: пользователи уходят в чат-боты и поиск без ИИ
Первые трещины в поиске Google: пользователи уходят в чат-боты и поиск без ИИ

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.