Дапамажыце dev.by 🤍
Падтрымаць

Кампаніі пачалі прадаваць перапіскі супрацоўнікаў для навучання ШІ

Кампаніі пачалі зарабляць на ўласных працоўных перапісках, лістах і дакументах, прадаючы іх як дадзеныя для навучання ШІ. Карпаратыўныя дадзеныя становяцца каштоўным актывам на фоне дэфіцыту якасных дадзеных для трэніроўкі мадэляў.

1 каментарый
Кампаніі пачалі прадаваць перапіскі супрацоўнікаў для навучання ШІ

Кампаніі пачалі зарабляць на ўласных працоўных перапісках, лістах і дакументах, прадаючы іх як дадзеныя для навучання ШІ. Карпаратыўныя дадзеныя становяцца каштоўным актывам на фоне дэфіцыту якасных дадзеных для трэніроўкі мадэляў.

Былы генеральны дырэктар сервісу для стварэння субтытраў cielo24 Шанна Джонсан распавяла Forbes, што пры закрыцці бізнесу прадала 13-гадовы масіў карпаратыўных дадзеных — ад перапісак у Slack да задач у Jira. Паводле яе, здзелка прынесла «сотні тысяч долараў» і дапамагла завяршыць ліквідацыю кампаніі без даўгоў.

«Мне дасюль цяжка закрываць кампанію, — распавяла яна. — Але прыемна думаць, што нашы дадзеныя могуць быць карысныя і працягнуць жыць, дапамагаючы іншым».

Выданне адзначае, што цікавасць да такіх дадзеных рэзка ўзрасла пасля таго, як ШІ-кампаніі фактычна вычарпалі адкрытыя крыніцы для навучання мадэляў. Як адзначаюць у індустрыі, для развіцця агентных мадэляў, здольных выконваць рэальныя задачы, патрэбны не абстрактныя тэксты, а прыклады рэальнай працы: з памылкамі, кантэкстам і ўнутранай логікай працэсаў.

На гэтым фоне фарміруецца новы рынак. Стартап SimpleClosure, які дапамагае закрываць кампаніі, запусціў платформу для продажу карпаратыўных архіваў. «Ствараецца адчуванне сапраўднай залатой ліхаманкі: кампаніі спрабуюць любой цаной атрымаць рэальныя дадзеныя», — заявіў генеральны дырэктар Доры Ёна. За апошні год кампанія правяла каля 100 здзелак і вярнула заснавальнікам больш за $1 мільён, звычайна выплачваючы ад $10 да $100 тысяч за адзін архіў.

«Всё стало намного хуже»: сотрудники разгребают «воркслоп» от ИИ вместо работы
«Усё стала намнога горш»: супрацоўнікі разграбаюць «воркслоп» ад ШІ замест працы
Па тэме
«Усё стала намнога горш»: супрацоўнікі разграбаюць «воркслоп» ад ШІ замест працы

Кошт дадзеных залежыць ад іх структуры і «насычанасці». Як тлумачыць кіраўнік канкуруючага сервісу Sunset Брэндан Махоні, звязаная інфармацыя — напрыклад, задача ў Jira, прывязаная да канкрэтнага коміта — цэняць вышэй, чым разрозненыя дакументы. Асабліва дарагімі лічаць дадзеныя са сфераў фінансаў і аховы здароўя.

Аднак рост рынку выклікае і сур’ёзныя пытанні пра прыватнасць. Эксперты адзначаюць, што нават пры фармальнай ананімізацыі застаюцца рызыкі ўцечак і паўторнай ідэнтыфікацыі. «Гэта не абязлічаныя дадзеныя — за імі стаяць рэальныя людзі», — тлумачыць Марк Ротэнберг з Center for AI and Digital Policy. Яго арганізацыя ўжо заклікала рэгулятараў вывучыць такія практыкі.

Праблема ўскладняецца тым, што поўная ачыстка дадзеных практычна немагчымая. «Калі ананімізацыя выканана няправільна, ёсць рызыка, што можна будзе ўбачыць дзеянні асобных людзей і кампаній, а ў горшым выпадку гэтыя дадзеныя могуць трапіць у адказы мадэлі», — кажа Бобі Сэмюэлс з Protege. Больш за тое, даследаванні паказваюць, што моўныя мадэлі здольныя запамінаць і ўзнаўляць фрагменты навучальных дадзеных.

Паралельна развіваецца новая індустрыя так званых «RL-трэнажораў» — сімуляваных працоўных асяроддзяў, дзе ШІ-агенты навучаюцца на аснове рэальных карпаратыўных дадзеных. Буйныя гульцы ўжо інвестуюць у гэты напрамак: паводле крыніц, Anthropic разглядае ўкладанні да $1 мільярда.

Duolingo передумала учитывать ИИ-скиллы на ревью вот почему
Duolingo перадумала ўлічваць ШІ-навыкі на рэвью, вось чаму
Па тэме
Duolingo перадумала ўлічваць ШІ-навыкі на рэвью, вось чаму
ИИ-агенты в GitHub могут красть учётные данные
ШІ-агенты ў GitHub могуць красці ўліковыя дадзеныя
Па тэме
ШІ-агенты ў GitHub могуць красці ўліковыя дадзеныя
«Миру не хватает токенов»: в ИИ-индустрии острый дефицит мощностей
«Свету не хапае токенаў»: у ШІ-індустрыі востры дэфіцыт магутнасцяў
Па тэме
«Свету не хапае токенаў»: у ШІ-індустрыі востры дэфіцыт магутнасцяў
Чытайце таксама
ШІ дапамагае супрацоўнікам падрабляць чэкі, якія немагчыма адрозніць ад сапраўдных
ШІ дапамагае супрацоўнікам падрабляць чэкі, якія немагчыма адрозніць ад сапраўдных
ШІ дапамагае супрацоўнікам падрабляць чэкі, якія немагчыма адрозніць ад сапраўдных
OpenAI паказала ўнутраныя ШІ-сэрвісы — і выклікала паніку на рынку софту
OpenAI паказала ўнутраныя ШІ-сэрвісы — і выклікала паніку на рынку софту
OpenAI паказала ўнутраныя ШІ-сэрвісы — і выклікала паніку на рынку софту
Софт-скілы цэняцца на рынку больш за тэхнічныя, і ўжо шмат гадоў
Софт-скілы цэняцца на рынку больш за тэхнічныя, і ўжо шмат гадоў
Софт-скілы цэняцца на рынку больш за тэхнічныя, і ўжо шмат гадоў
2 каментарыя
За ШІ-навыкі кампаніі гатовы пераплачваць — вось наколькі
За ШІ-навыкі кампаніі гатовы пераплачваць — вось наколькі
За ШІ-навыкі кампаніі гатовы пераплачваць — вось наколькі

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Яна Пильник
Яна Пильник Дрессировщик программистов в Филиал БГУ ЦИРК
0

А ну-ка дайте контакт, кто там платит за переписку «сотни тысяч долларов»

Пользователь отредактировал комментарий 17 апреля 2026, 13:38