«Менее чем один из двадцати специалистов по безопасности обладает базовой компетенцией и базовыми знаниями, чтобы вывести систему из совершенно неизвестного состояния безопасности с помощью сопоставления, тестирования уязвимостей, взлома паролей, тестирования модема, уязвимостей. установка исправлений, настройка брандмауэра, инструментирование, обнаружение вирусов в нескольких точках входа и даже с помощью резервного копирования и управления конфигурацией».
― Стивен Норткатт, Обнаружение сетевых вторжений: справочник аналитика

В этой статье рассматривается реализация IDS (системы обнаружения вторжений) с использованием алгоритма случайного леса машинного обучения.

Что вы подразумеваете под IDS? Система обнаружения вторжений (IDS) — это технология сетевой безопасности, изначально созданная для обнаружения использования уязвимостей в целевом приложении или компьютере.

Набор данных, используемый для этого проекта, указан ниже, а ссылка доступна на GitHub для справки kddcup.data_10_percent: «https://github.com/edyoda/pyspark-tutorial/blob/master/kddcup.data_10_percent.gz

Для реализации используется Python, Jupiter Notebook (предпочтительно):

Во-первых, импортируются pandas и TensorFlow, так как основные библиотеки, которые нам нужны, будут доступны. Затем путь к набору данных предоставляется с помощью try catch, и в случае возникновения какой-либо ошибки будет выдана ошибка загрузки. Затем команда чтения файла используется для чтения набора данных. Чтение строк и вывод их статуса.

После этого импортируется библиотека os вместе с numpy, sklearn, scipy.stats.

Логическая категоризация и анализ данных. Ниже приведены результаты анализа данных.

На этом этапе набор данных обучается, а затем тестируется. Позже импорт и установка набора данных в классификатор случайного леса с оценкой 20 и вычисление его оценки. Благодаря этому алгоритму достигается хорошая точность и улучшается производительность системы. Таким образом, с помощью Python для обнаружения вторжений все будет проще, и, наконец, система будет успешно реализована. Код скоро будет загружен на GitHub.

Следите за интересными материалами, связанными с сетевой безопасностью и ее применением.

Хорошего дня!