17% скидка на размещение рекламы на площадках devby — до 20 ноября. Клац!
Support us

ИИ хуже людей резюмирует информацию — по всем параметрам

Искусственный интеллект хуже людей резюмирует документы и, скорее, даже создаёт им дополнительную работу. К такому выводу пришла Amazon по итогам экспериментов, заказанных Австралийской комиссией по ценным бумагам и инвестициям (ASIC).

Оставить комментарий
ИИ хуже людей резюмирует информацию — по всем параметрам

Искусственный интеллект хуже людей резюмирует документы и, скорее, даже создаёт им дополнительную работу. К такому выводу пришла Amazon по итогам экспериментов, заказанных Австралийской комиссией по ценным бумагам и инвестициям (ASIC).

Исследователи тестировали разные генеративные ИИ-модели, из которых выбрали одну самую многообещающую — опенсорсную Llama2-70B от Meta. Ей скормили тексты пяти ответов на парламентский запрос к аудиторским и консалтинговым фирмам, которые модель должна была резюмировать с фокусом на упоминания ASIC, рекомендации и прочее, а также указать страницы и контекст.

То же задание поручили десяти сотрудникам ASIC разного ранга. Далее работы модели и людей дали группе рецензентов на «слепую» проверку по таким параметрам, как связность, длина, а также тем по тем пунктам, на которых нужно было сфокусироваться в резюме. О том, что в исследовании участвует ИИ, они не знали.

Работы живых сотрудников оказались качественнее работ ИИ по всем критериям во всех пяти случаях: 81% против 47%. Человеческие резюме значительно опережали ИИ в плане поиска ссылок на документы ASIC в длинном тексте. В машинных резюме часто было упущено основное, детали и контекст, акцент мог делаться на второстепенных деталях, могла добавляться некорректная информация, отсутствовала релевантная и присутствовала — нерелевантная информация.

В целом рецензенты посчитали, что ИИ-резюме могут быть контрпродуктивны и создавать ненужную работу, потому что их нужно перепроверять и сверять с оригинальными текстами. При этом отмечается, что у новой версии модели способность резюмировать тексты может быть уже лучше, а также что Amazon повысила производительность испытуемой модели путём кастомизации промптов, а это означает наличие пространства для дальнейших улучшений.

GitHub: 97% разработчиков используют ИИ
GitHub: 97% разработчиков используют ИИ 
По теме
GitHub: 97% разработчиков используют ИИ
Klarna заменил маркетологов на ИИ, а теперь хочет убрать половину штата
Klarna заменил маркетологов на ИИ, а теперь хочет убрать половину штата
По теме
Klarna заменил маркетологов на ИИ, а теперь хочет убрать половину штата
Читайте также
65% топовых ИИ-компаний допустили массовые утечки данных на GitHub
65% топовых ИИ-компаний допустили массовые утечки данных на GitHub
65% топовых ИИ-компаний допустили массовые утечки данных на GitHub
Классика: ИИ-стартап уволил тысячи подрядчиков, а потом нанял назад — на четверть дешевле
Классика: ИИ-стартап уволил тысячи подрядчиков, а потом нанял назад — на четверть дешевле
Классика: ИИ-стартап уволил тысячи подрядчиков, а потом нанял назад — на четверть дешевле
Создатели популярного ИИ-сервиса притворялись ботами, чтобы запустить стартап
Создатели популярного ИИ-сервиса притворялись ботами, чтобы запустить стартап
Создатели популярного ИИ-сервиса притворялись ботами, чтобы запустить стартап
Появился вайбкодинговый «брейнрот»-редактор с TikTok, Tinder и гемблингом для вашей продуктивности — пользователи подумали, что это шутка
Появился вайбкодинговый «брейнрот»-редактор с TikTok, Tinder и гемблингом для вашей продуктивности — пользователи подумали, что это шутка
Появился вайбкодинговый «брейнрот»-редактор с TikTok, Tinder и гемблингом для вашей продуктивности — пользователи подумали, что это шутка

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.