Дапамажыце dev.by 🤍
Падтрымаць

Деанонимизация программиста по стилометрии кода

2 каментарыя
Деанонимизация программиста по стилометрии кода

У каждого программиста есть специфические профессиональные приёмы и привычки. Поэтому в исходном коде остаются следы, выдающие автора, как почерк или отпечатки пальцев выдают человека.

Читать далее

С помощью компьютерного анализа можно вычислить уникальный «отпечаток» программиста и идентифицировать автора по его коду. Такую задачу поставила перед собой группа исследователей из университета Дрекселя (США), университета штата Мэриленд, университета Гёттингена (Германия) и Принстонского университета.

Учёные разработали программу для стилометрии кода и применили его на листингах, публично доступных после программистского конкурса Google Code Jam. Этот конкурс привлекает тысячи участников самого разного уровня: от школьников и студентов до профессионалов и опытных хакеров.

Стилометрия — исследование стилистики, включающее статистический анализ текста. В данном случае алгоритм раскладывает код на блоки и строит синтаксическое дерево, как показано на диаграмме.

В этом дереве распознаются отдельные синтаксические конструкции и подсчитывается их количество.

Программу тренировали на коде, написанном 250 программистами в течение нескольких лет, в среднем, по 630 строк кода на каждого. После этого программа продемонстрировала точность 95% при распознавании автора анонимного кода.

На выборке из 30 программистов с большим количеством исходного материала (1900 строк) точность распознавания повысилась до 97%.

Результаты опубликованы в научной статье «Деанонимизация программистов по стилометрии кода».

Чытайце таксама
Усе праўкі кода ад ШІ ў Amazon цяпер павінны ўзгадняцца з дасведчанымі інжынерамі, каб больш не ламаць сэрвісы на гадзіны
Усе праўкі кода ад ШІ ў Amazon цяпер павінны ўзгадняцца з дасведчанымі інжынерамі, каб больш не ламаць сэрвісы на гадзіны
Усе праўкі кода ад ШІ ў Amazon цяпер павінны ўзгадняцца з дасведчанымі інжынерамі, каб больш не ламаць сэрвісы на гадзіны
OpenAI запусціла ШІ-агента, які сам шукае і выпраўляе хібы
OpenAI запусціла ШІ-агента, які сам шукае і выпраўляе хібы
OpenAI запусціла ШІ-агента, які сам шукае і выпраўляе хібы
1 каментарый
Стваральнік Claude Code кажа, што назва «распрацоўшчык праграмнага забеспячэння» пачне паміраць ужо ў гэтым годзе
Стваральнік Claude Code кажа, што назва «распрацоўшчык праграмнага забеспячэння» пачне паміраць ужо ў гэтым годзе
Стваральнік Claude Code кажа, што назва «распрацоўшчык праграмнага забеспячэння» пачне паміраць ужо ў гэтым годзе
4 каментарыя
З'явіўся вайбкодынгавы «брэйнрот«-рэдактар з TikTok, Tinder і гемблінгам для вашай прадуктыўнасці — карыстальнікі палічылі, што гэта жарт
З'явіўся вайбкодынгавы «брэйнрот«-рэдактар з TikTok, Tinder і гемблінгам для вашай прадуктыўнасці — карыстальнікі палічылі, што гэта жарт
З'явіўся вайбкодынгавы «брэйнрот«-рэдактар з TikTok, Tinder і гемблінгам для вашай прадуктыўнасці — карыстальнікі палічылі, што гэта жарт
1 каментарый

Хочаце паведаміць важную навіну? Пішыце ў Telegram-бот

Галоўныя падзеі і карысныя спасылкі ў нашым Telegram-канале

Обсуждение
Комментируйте без ограничений

Релоцировались? Теперь вы можете комментировать без верификации аккаунта.

Комментариев пока нет.