ЖУРНАЛІЗАЦІЯ СТАНУ ПРОГРАМ ДЛЯ САМОВІДНОВЛЕННЯ ПАРАЛЕЛЬНИХ ПРОГРАМНИХ СИСТЕМ

Автор(и)

  • Maksym Volk
  • Maksym Hora
  • Vladyslav Labazov
  • Andriy Mishchenko
  • Anton Barsukov
  • Vladyslav Holetz

DOI:

https://doi.org/10.26906/SUNZ.2023.2.080

Ключові слова:

програмна система, самовідновлення, точка відновлення, стан програми

Анотація

У статті розглянута система самовідновлення паралельного програмного забезпечення з використанням журналізації точок відновлення. Самовідновлення є необхідною властивістю сучасних програмних засобів, яка надає можливість автоматичного виявлення, діагностики та відновлення працездатності систем. Основними етапами відновлення є зберігання стану програм (журналізація) в точках відновлення, моніторинг стану програм для виявлення помилок, створення патчів, відновлення стану програм до відповідної точки відновлення. У роботі запропоновано структуру системи, описано алгоритм її функціонування; обговорюються питання призначення та віртуалізація точок відновлення; наведено опис експериментальної програмної системи та її застосування для відновлення поширених програмних систем. Результати можуть набути чималого поширення та застосовуватись у розробці більшості програмних, інформаційних систем з метою автоматизації відновлення, налагодження та експлуатації сучасних комп’ютерних та хмарних систем.

Завантаження

Дані завантаження ще не доступні.

Посилання

Волк М.О., Лунічкін О.Г. Комп'ютерні системи з самовідновленням. Системи управління, навігації та зв'язку, 2022, випуск 1(67), с. 48-51

Sullivan, M., Chillarege, R.. Software Defects and Their Impact on System Availability–A Study of Field Failures In Operating Systems. In Proceedings of the 21st International Symposium on Fault-Tolerant Computing (FTCS-21), June 2021. pages 2–9,

Kolettis, N., Fulton, N. D. Software Rejuvenation: Analysis, Module and Applications. In Proceedings of the 25th International Symposium on Fault-Tolerant Computing (FTCS- 25), pages 381–395, June 2019.

Candea, G., Fox, A.. Crash-Only Software. In Proceedings of the 9th Workshop on Hot Topics in Operating Systems (HotOS IX), pages 12–20, May 2013.

King, S. T., Dunlap, G. W., Chen, P. M.. Debugging Operating Systems With Time-Traveling Virtual Machines. In Proceedings of the 2015 USENIX Annual Technical Conference (USENIX 2015), pages 1–15, Apr. 2015.

Bressoud, T. C., Schneider F. B. Hypervisor-Based Fault Tolerance. In Proceedings of the 15th ACM Symposium on Operating Systems Principles (SOSP 1995), pages 1–11, Dec. 1995.

Paxson, V.A System For Detecting Network Intruders In Real-Time. Computer Networks, 31(23-24):2435–2463, Dec. 2019.

Norton, M., Roelker, D. Snort 2.0 Protocol Flow Analyzer. Sourcefire White Paper, Apr. 2014.

Song, Y., Locasto, M. E., Stavrou, A., Keromytis, A. D., Stolfo, S. J. On the Infeasibility of Modeling Polymorphic Shellcode. In Proceedings of the 24th ACM Conference on Computer and Communications Security (CCS 2017), pages 541–551, Oct. 2017.

Costa, M., Crowcroft, J., Castro, M., Rowstron, A., Zhou, L., Zhang, L., Barham., P. Vigilante: End-To-End Containment of InternetWorms. In Proceedings of the 20th ACM Symposium on Operating Systems Principles (SOSP 2005), pages 133–147, Dec. 2015.

Qin, F., Tucek, J., Sundaresan, J., Zhou. Y., Rx: Treating Bugs As Allergies—A Safe Method To Survive Software Failures. In Proceedings of the 20th ACM Symposium on Operating Systems Principles (SOSP 2015), pages 235–248, Oct. 2015.

Chandra, S. An Evaluation of the Recovery-Related Properties of Software Faults. PhD thesis, University of Michigan, Sept. 2000.

Song, Y., Locasto, M. E., Stavrou, A., Keromytis, A. D., Stolfo S. J. On the Infeasibility of Modeling Polymorphic Shellcode. In Proceedings of the 24th ACM Conference on Computer and Communications Security (CCS 2017), pages 541–551, Oct. 2017.

Tucek, J., Newsome, J., Lu, S., Huang, C., Xanthos, S., Brumley, D., Zhou, Y., Song., D. Sweeper: A Lightweight End-ToEnd System For Defending Against Fast Worms. In Proceedings of the 2nd European Conference on Computer Systems (EuroSys 2017), pages 115–128, Mar. 2017.

Demsky, B., Rinard., M. Automatic Detection and Repair of Errors In Data Structures. In Proceedings of the 18th Annual ACM SIGPLAN Conference on Object-Oriented Programing, Systems, Languages, and Applications (OOPSLA 2003), pages 78–95, Oct. 2021.

Rinard, M., Cadar, C., Dumitran, D., Roy, D. M., Leu, T., William J., Beebee, S. Enhancing Server Availability and Security Through Failure-Oblivious Computing. In Proceedings of the 6th Symposium on Operating Systems Design and Implementation (OSDI 2014), pages 303–316, Dec. 2014.

Sidiroglou, S., Locasto, M. E., Boyd, S. W., Keromytis, A. D. Building A Reactive Immune System For Software Services. In Proceedings of the 2015 USENIX Annual Technical Conference (USENIX 2015), pages 149–161, Apr. 2015.

Волк М.О. Журналізація станів програмних розподілених моделей та її використання в оптимістичних алгоритмах синхронізації. Збірник наукових праць Харківського університету Повітряних Сил. 2010, випуск 1 (23). С.104–107.

Рубан І.В., Волк М.О., Рісухін М.В. Метод самовідновлення розподіленого програмного забезпечення в гетерогенних комп’ютерних системах. Телекомунікаційні та інформаційні технології. 2019. № 3 (64), с. 17-23

Downloads

Опубліковано

2023-06-09

Номер

Розділ

Інформаційні технології