Програмистът може да бъде разпознат и по компилирания двоичен код

Много програмисти по най-различни причини желаят да останат анонимни. Съществува научна работа, в която се описват методи за разкриване на програмиста по стила на написания от него сорс-код и вече дори има автоматизирано разпознаване на програмистите, което работи с точност 94%. С помощта на машинно обучение и евристични алгоритми системата разпознава 1600-те програмиста от Google Code Jam с впечатляваща точност по написания от тях сорс-код.

 

Сега се появи информация, че разпознаването на програмиста може да стане чрез анализ на вече компилирания двоичен изпълним код при липса на сорс-текстовете. В новата научна работа са използвани програмите на 600 програмиста от Google Code Jam. На програмистите се давали еднакви задачи, за да се изяви стила на програмиране, а не основния алгоритъм. Авторите на научната работа съобщиха, че характерните признаци и стил се запазват и след компилирането, но в този случай точността спада до 65%.

С помощта на дизасемблиране се съставят абстрактни синтактични дървета, анализира се изпълнението на кода и се класифицират основните признаци на кодирането.

 

Интересно е това, че професионалните програмисти се разпознават по-лесно от начинаещите, понеже имат вече изграден индивидуален стил на програмиране.

 

Авторите на изследването са уверени, че с помощта на техните методи ще бъдат разкрити авторите на Bitcoin, TrueCrypt и най-вредните компютърни вируси.

Коментари
Все още няма коментари
Статистика
Прегледи 138
Коментари 0
Рейтинг
Добавена на05 Ян 2016
ИзточникKaldata

Тагове
Code, Google