Живете в Польше? Поддержите devby 1,5% налога: бесплатно и за 5 минут 🤗
Support us

Учёные предупреждают: ИИ-системы, обученные на контенте, который сгенерирован другими ИИ-системами, через пару поколений начнут генерировать мусор

В сети плодится контент, порождённый искусственным интеллектом. Эксперты в области машинного обучения считают, что в дальнейшем ИИ-алгоритмы, которые тренировались на нём, а не на аутентичном материале, будут выдавать всё менее качественные результаты.

1 комментарий
Учёные предупреждают: ИИ-системы, обученные на контенте, который сгенерирован другими ИИ-системами, через пару поколений начнут генерировать мусор

В сети плодится контент, порождённый искусственным интеллектом. Эксперты в области машинного обучения считают, что в дальнейшем ИИ-алгоритмы, которые тренировались на нём, а не на аутентичном материале, будут выдавать всё менее качественные результаты.

В мае британско-канадская группа учёных опубликовала работу на тему того, что будет, если несколько поколений ИИ-систем тренировать на контенте, сгенерированном подобными им системами.

Один из соавторов исследования — учёный и профессор Кембриджского университета Росс Андерсон — отмечает, что текст будет становиться мусором. Например, в одном случае ИИ-система 9 поколения, обученная на материале о средневековой архитектуре, выдавала что-то невнятное о зайцах. Такой деградации моделей (model collapse) подвержены и генераторы изображений. 

Большие языковые модели вроде тех, что в основе ChatGPT, тренировались на огромных массивах данных из интернета, которые до недавнего времени в большинстве своём были созданы людьми. Но по мере распространения ИИ-инструментов сеть наводняют результаты их «труда» и попадают в тренировочные датасеты новых моделей.

«Крёстный отец ИИ»: чатботы глупее собак и котов и видеть в ИИ угрозу — абсурдно
«Крёстный отец ИИ»: чатботы глупее собак и котов, и видеть в ИИ угрозу — абсурдно
По теме
«Крёстный отец ИИ»: чатботы глупее собак и котов, и видеть в ИИ угрозу — абсурдно

Это значит, что постепенно их качество и точность будет падать, а вероятность ошибок и бессмыслицы — возрастать. Тем более что ИИ не умеет отличать правду от вымысла и начинает неверно истолковывать то, что считает правдивым, говорят учёные.

Для примера Андерсон взял Моцарта и его менее знаменитого современника, итальянского композитора Антонио Сальери. Если обучить модель на работах Моцарта, то получится похоже, но без искры таланта австрийца — условно это Сальери. Если на музыке Сальери обучить новую модель и так — ещё несколько поколений, то их звучание будет всё больше отдаляться от оригинала.

По словам учёных, проблема связана с восприятием ИИ вероятности — со временем менее вероятные события появляются в результатах моделей всё реже, и это ограничивает то, что ИИ следующего поколения будет считать вероятным.

Стартап с «AI» в названии и месяц возрастом привлёк $113 млн
Стартап с «AI» в названии и месяц возрастом привлёк $113 млн
По теме
Стартап с «AI» в названии и месяц возрастом привлёк $113 млн
OpenAI получила первый иск за «галлюцинации» у ChatGPT
OpenAI получила первый иск за «галлюцинации» у ChatGPT
По теме
OpenAI получила первый иск за «галлюцинации» у ChatGPT
Поддержите редакцию 1,5% налога: бесплатно и за 5 минут

Как помочь, если вы в Польше

Читайте также
McKinsey похвасталась запуском 25 000 ИИ-агентов. Конкуренты: цифры ничего не значат
McKinsey похвасталась запуском 25 000 ИИ-агентов. Конкуренты: цифры ничего не значат
McKinsey похвасталась запуском 25 000 ИИ-агентов. Конкуренты: цифры ничего не значат
3 комментария
Google представила Gemini 3 Deep Think — мощный ИИ для науки и инженерии
Google представила Gemini 3 Deep Think — мощный ИИ для науки и инженерии
Google представила Gemini 3 Deep Think — мощный ИИ для науки и инженерии
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
Индийские ИТ-компании потеряли $50 млрд из-за ИИ с начала февраля — худший результата почти за год
2 комментария
В сети вирусится кампания QuitGPT — бойкот ChatGPT
В сети вирусится кампания QuitGPT — бойкот ChatGPT
В сети вирусится кампания QuitGPT — бойкот ChatGPT

Хотите сообщить важную новость? Пишите в Telegram-бот

Главные события и полезные ссылки в нашем Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

0

Ну да, согласен. А перед этим заведут ещё блоги и инстаграмы, и уже там и будут генерировать мусор.