Я работаю над проектом, в котором у меня есть файлы изображений, которые были искажены (нечеткие, т.е. их данные изображения были изменены). Эти файлы при рендеринге на разных платформах приводят к предупреждению/сбою/отчету о прохождении от платформы.
Я пытаюсь создать защиту, используя неконтролируемое машинное обучение, которое поможет мне идентифицировать/классифицировать эти изображения как вредоносные или нет. У меня есть бинарные данные этих файлов, но я понятия не имею, какой набор функций/шаблонов я могу определить из этого, потому что визуально эти изображения могут быть чем угодно. (Мне нужно найти набор функций из двоичных данных)
Мне нужен совет по поводу инструментов/методов, которые я мог бы использовать для автоматического извлечения признаков из этих двоичных данных; наборы функций, которые я могу использовать с алгоритмами обучения без присмотра, такими как SOM Коэнена и т. д.
Я новичок в этом, любая помощь будет здорово!