На этот раз предметом нашего небольшого исследования (первая часть нашего ликбеза доступна
здесь) станет весьма интересный подход к анализу данных, поступающих в IT-инфраструктуру компании, а иногда и в технологические сети предприятий. Разумеется, мы имеем ввиду не просто информацию, а анализ объектов.
Что такое объект в нашем случае? Это файл. Он, в свою очередь, представляет собой последовательность данных, сохраненных в некоторую сущность. По сути — область диска, содержащая нули и единички в определенной последовательности. Интересно, что и обычное электронное письмо, которое прилетает в вашу почтовую программу (Outlook, Mail, Thunderbird и т.д.), тоже на самом деле имеет формат .eml. Так что и это объекты.
Чтобы анализировать их не обычными индикаторами (имя файла, контрольная сумма объекта или другие атрибуты файла), а делать это глубже и детальнее, были придуманы методики поведенческого — или динамического — анализа. Вообще существует два основных способа анализа файлов: статический, когда файл оценивается без запуска (открытия), и динамический, когда он запускается на рабочем компьютере или в изолированной среде.
В целом, обе эти методики используются классами решений, которые сегодня будут в центре нашего внимания, однако основной профит от их использования — в динамическом анализе. Ну что, начнем?