Все по графику: в ЛЭТИ разработали программу для защиты от кибератак

Доцент кафедры ИС Евгения Сергеевна Новикова

Современные информационные системы зачастую подвергаются серьезным кибер-атакам. Так, например, по данным компании «Ростелеком-Солар», 92% кибератак, совершенных высокопрофессиональными злоумышленниками в 2021 году, были направлены на объекты критической информационной инфраструктуры, а именно государственные организации, предприятия энергетики, промышленности и военно-промышленного комплекса.

Для обеспечения безопасности кибер-физических объектов, таких как «умные» системы очистки водоснабжения или ракетные двигатели, используются методы машинного обучения и искусственного интеллекта. На основании выявленных ранее аномалий появляется возможность в будущем предотвратить подобную кибератаку. Чтобы алгоритмы машинного обучения работали корректно, необходимы размеченные данные – данные, дополненные тегами о типах атак или аномалий с присвоением справочных тегов или выходной информацией.

Ручная разметка данных – это непростая и дорогостоящая задача. Для ее решения ученые кафедры информационных систем (ИС) СПбГЭТУ «ЛЭТИ» разработали специальный инструмент, программное обеспечение (ПО), которое позволит упростить ручную разметку за счет автоматизированного определения различных состояний объекта, выявления выбросов и применения интерактивных моделей визуализации.

«Новизна предлагаемого инструмента состоит в реализуемой методике выявления аномалий путем построения интегрального показателя оценки изменения состояний объекта, позволяющего выявить аномалии в поведении, алгоритме его вычисления и подходе к визуальной разметке данных на основе данного показателя». - Руководитель проекта, доцент кафедры ИС Евгения Сергеевна Новиков

Работа ПО основана на вычислении триангуляции Делоне для последовательности точек данных, описывающих состояние кибер-физического объекта на заданном интервале времени. Полученное интегральное значение может быть легко визуализировано на временной шкале. График изменения данного значения способен отражать изменение состояния объекта во времени, а всплески и пики укажут как на возможные отклонения от нормы в состоянии объекта, так и на переходные состояния в его функционировании. По словам ученых, эта методика сравнима по точности с наиболее популярными алгоритмами выявления аномалий, не требующих размеченных данных, а по вычислительной эффективности превосходит их почти в 3 раза.

«На данный момент существует множество Open Source-аналогов для разметки данных, среди которых инструменты Label Studio и TagAnomaly и другие. Однако работа этих программ не подразумевает свертывание и группировку данных в один интегральный показатель, что является преимуществом нашего ПО». - Аспирант кафедры ИС Антон Шулепов

Разработанное ПО универсально по сфере использования и найдет свое место в работе компаний, занимающихся разработкой средств защиты информации, которым для обучения моделей машинного обучения, широко используемых сейчас в информационной безопасности, требуются размеченные наборы данных.

На данный момент проект находится на этапе тестирования разработанного программного инструмента и выполнения экспериментов на различных наборах данных для оценки его эффективности. Далее планируется доработка методики выявления аномалий и подача заявления на патент.

Проект «Программное средство аннотирования многомерных данных для выявления аномалий в поведении кибер-физических объектов» поддержан грантом конкурса научно-исследовательских, опытно-конструкторских и технологических проектов СПбГЭТУ «ЛЭТИ». Проект получил финансирование на реализацию в размере 400 тысяч рублей.