МЕТОД ПІДВИЩЕННЯ ОПЕРАТИВНОСТІ КЛАСИФІКАЦІЇ ДАНИХ ЗА РАХУНОК ЗМЕНШЕННЯ КОРЕЛЯЦІЇ ОЗНАК

  • Svitlana Gavrylenko
  • Vadym Poltoratskyi
Ключові слова: машинне навчання, класифікація даних, попередня обробка даних, кореляція даних, комп’ютерні мережі, нейронні мережі, ансамблеві класифікатори, системи виявлення вторгнень

Анотація

Об'єктом дослідження є процес ідентифікації стану комп'ютерної мережі. Предметом дослідження є методи ідентифікації стану комп’ютерних мереж. Метою статті є підвищення оперативності виявлення вторгнень у комп’ютерні мережі за рахунок зменшення кореляції ознак. Методи, що використовуються: методи штучного інтелекту, машинного навчання, методи зменшення кореляції ознак. Отримано такі результати: Досліджено ефективність використання підходів, які зменшують кореляцію даних: метод головних компонентів (PCA), незалежних компонентів (ICA), L1 та L2 регуляризацію, обґрунтовано метод для подальшого дослідження. За результатами досліджень запропоновано спеціальну процедуру зменшення кореляції вихідних даних. Для оцінки якості та оперативності запропонованої процедури, розроблено програмні моделі на основі: Gradient Boosting, Random Forest, повнозв’язної нейронної мережі (FCNN) та згорткової нейронної мережі (CNN). У якості вихідних даних використано набір UNSWNB 15, який містить інформацію про нормальне функціонування мережі та під час вторгнень. Виконано порівняльний аналіз якості та оперативності розроблених моделей. Висновки. Наукова новизна отриманих результатів полягає у розробці методу виявлення вторгнень в комп’ютерні мережі, який відрізняється від відомих наявністю спеціальної процедури зменшення кореляції вихідних даних, що дозволило підвищити оперативність процесу ідентифікації.

Завантаження

Дані про завантаження поки що недоступні.

Посилання

1. Vergara, J.R., Estévez, P.A. A review of feature selection methods based on mutual information. Neural Comput & Applic , 2014, Vol.24, pp.175–186. https://doi.org/10.1007/s00521-013-1368-0
2. Hoque, N., Bhattacharyya, D.K., & Kalita, J.K. MIFS-ND: A mutual information-based feature selection method. Expert Syst. Appl., 2014, Vol.41, 6371-6385.https://www.researchgate.net/publication/262526444_MIFS-ND_A_mutual_informationbased_feature_selection_method
3. Smita Chormunge, Sudarson Jena. (). Correlation based feature selection with clustering for high dimensional data. Journal of Electrical Systems and Information Technology, 2018, Vol. 5 (3), pp.542-549. https://doi.org/10.1016/j.jesit.2017.06.004
4. Hall, M.A. (). Correlation-based feature selection of discrete and numeric class machine learning, Working paper. Hamilton, New Zealand: University of Waikato, Department of Computer Science., 2000, pp.1-10. https://hdl.handle.net/10289/1024
5. Krzysztof Michalak, Halina Kwasnicka. Correlation–based feature selection strategy in classification problems. Int. J. Appl. Math. Comput. Sci., 2006, Vol. 16(4), pp.503–511. https://bibliotekanauki.pl/articles/908379.pdf
6. Ibrahim, S.; Nazir, S.; Velastin, S.A. Feature Selection Using Correlation Analysis and Principal Component Analysis for Accurate Breast Cancer Diagnosis. J. Imaging, 2021, Vol.7, pp. 225-241. https://doi.org/10.3390/jimaging7110225
7. F. Vrins, J. A. Lee, M. Verleysen, V. Vigneron and C. Jutten, "Improving independent component analysis performances by variable selection," 2003 IEEE XIII Workshop on Neural Networks for Signal Processing (IEEE Cat. No.03TH8718), Toulouse, France, 2003, pp. 359-368, doi: https://10.1109/NNSP.2003.1318035 .
8. Ng. Andrew. Feature selection, L 1 vs. L 2 regularization, and rotational invariance. Proceedings of the Twenty-First International Conference on Machine Learning, 2004, pp 78-84. https://dl.acm.org/doi/10.1145/1015330.1015435
9. Karen Garate-Escamilla A, Hassani AHE, Andres E, Classification models for heart disease prediction using feature selection and PCA, Informatics in Medicine Unlocked , 2020, pp. doi: https://doi.org/10.1016/j.imu.2020.100330
10. Mishra, S., Sarkar, U., Taraphder, S., Datta, S., Swain, D., & Saikhom, R. et al. Multivariate Statistical Data Analysis- Principal Component Analysis (PCA). International Journal of Livestock Research, 2017, Vol.7(5), pp. 60-78. http://doi.org/10.5455/ijlr.20170415115235
Опубліковано
2023-12-12
Як цитувати
Gavrylenko Svitlana Метод підвищення оперативності класифікації даних за рахунок зменшення кореляції ознак / Svitlana Gavrylenko, Vadym Poltoratskyi // Системи управління, навігації та зв’язку. Збірник наукових праць. – Полтава: ПНТУ, 2023. – Т. 4 (74). – С. 70-74. – doi:https://doi.org/10.26906/SUNZ.2023.4.070.
Розділ
Інформаційні технології

Найбільш популярні статті цього автора (авторів)