ПОРІВНЯЛЬНИЙ АНАЛІЗ ЧАСОВИХ РЯДІВ
DOI:
https://doi.org/10.26906/SUNZ.2026.1.126Keywords:
математичне моделювання, короткий часовий ряд, порівняльний аналіз, ієрархічна процедура кластерного аналізу, міри близькості, дендрограма, функціонал якостіAbstract
Актуальність. Статистичні дані по більшості соціальних, демографічних, медичних, екологічних показниках збираються частіше за все раз на рік. Такі ряди доступні лише за невеликими за обсягом даними в декілька років, тобто є короткими часовими рядами. Більшість існуючих методів кластеризації не є придатними для аналізу коротких часових рядів. Тому актуальною є задача подання інформації про числові ряди таким чином, щоб вона була достатньою для цілей задач кластеризації саме для коротких часових рядів. Останнім часом в науковій літературі з’явились публікації з рекомендаціями надавати паралельно додаткову інформацію, що міститься у статистичних показниках вимірювань часових рядів, а також показники, які описують динаміку часових рядів, їх мінливість, але не залежать від часу. Залишається актуальною задача вибору мір близькості рядів. Існуючі дослідження щодо порівняльного аналізу мір близькості схиляються до того, що Евклідова відстань займає перші місця за якістю в задачах кластеризації часових рядів. Об’єкт дослідження: короткі часові ряди даних розповсюдженості окремих видів шкірних захворювань в регіонах Україні. Мета статті: порівняльний аналіз результатів кластеризації коротких часових рядів, отриманих із застосуванням різних мір близькості. Результати дослідження. У роботі досліджено часові ряди, що відображають дані з кількості випадків захворювань різними шкірними хворобами в регіонах України за певний період часу. Результати кластеризації таких часових рядів дають можливість зробити порівняльний аналіз даних і виявити групи регіонів України з «однаковою» ситуацією з цього питання. Висновки. Отримані результати можуть бути використані в подальших дослідженнях для виявлення причин відповідних рівнів захворюваності, таких, наприклад, як якість води, повітря, забруднення навколишнього середовища. Для вирішення цієї задачі автори, крім міри Евклідової відстані, застосовують міру близькості часових рядів за їх основними статистичними характеристиками та міру близькості показників динаміки досліджуваних рядів, а саме, рядів їх перших різниць. З методів кластеризації часових рядів обрана ієрархічна процедура. Проведено порівняльний аналіз отриманих результатів.Downloads
References
1. Kaufman L., Rousseeuw P.J. Finding groups in data: An introduction to cluster analysis. – Wiley, 2009. – 355 p. ISBN 0470317485, DOI: https://doi.org/10.1002/978047031680
2. Weiss S.M. A novel approximation to dynamic time warping allows anytime clustering of massive time series datasets. Proceedings of the 2012 SIAM International Conference on Data Mining. – pp. 999-1010, doi: https://doi.org/10.1137/1.9781611972825.86. DOI: https://doi.org/10.1137/1.9781611972825.86
3. Giusti R., Batista G.E. An empirical comparison of dissimilarity measures for time series classification. Proceedings of the Brazilian Conference on Intelligent Systems (BRACIS). – 2013. – pp. 82-88, doi: https://doi.org/10.1109/BRACIS.2013.2 DOI: https://doi.org/10.1109/BRACIS.2013.22
4. Ding H. et al. Querying and mining of time series data: experimental comparison of representations and distance measures. Proc. of the VLDB Endowment. – 2015. – vol. 1, issue 2. – pp. 1542-1552, doi: https://doi.org/10.14778/1454159.1454226 DOI: https://doi.org/10.14778/1454159.1454226
5. Dieng S., Michel P., Guindo A., Sallah K., Ba E.H., Cissé B., Carrieri M.P., Sokhna C., Milligan P., Gaudart J. Application of Functional Data Analysis to Identify Patterns of Malaria Incidence, to Guide Targeted Control Strategies. Int J Environ Res Public Health. – 2020 Jun 11. – 17(11):4168, doi: https://doi.org/10.3390/ijerph17114168 DOI: https://doi.org/10.3390/ijerph17114168
6. Vasilios Zarikas, Stavros G. Poulopoulos, Zoe Gareiou, Efthimios Zervas. Clustering analysis of countries using the COVID19 cases dataset. Data in Brief. – Vol. 31, 2020, 105787, doi: https://doi.org/10.1016/j.dib.2020.105787 DOI: https://doi.org/10.1016/j.dib.2020.105787
7. M. C. Lucic, H. Ghazzai, C. Lipizzi and Y. Massoud, "Integrating County-Level Socioeconomic Data for COVID-19 Forecasting in the United States", in IEEE Open Journal of Engineering in Medicine and Biology, vol. 2, pp. 235-248, 2021, doi: 10.1109/OJEMB.2021.3096135, doi: https://doi.org/10.1109/OJEMB.2021.3096135. DOI: https://doi.org/10.1109/OJEMB.2021.3096135
8. Yeongryeol Choi, Nahyeon An, Seokyoung Hong, Hyungtae Cho, Jongkoo Lim, In-Su Han, Il Moon, Junghwan Kim,Timeseries clustering approach for training data selection of a data-driven predictive model: Application to an industrial bio 2,3- butanediol distillation process, Computers & Chemical Engineering, Volume 161, 2022, 107758, ISSN 0098-1354, doi: https://doi.org/10.1016/j.compchemeng.2022.107758. DOI: https://doi.org/10.1016/j.compchemeng.2022.107758
9. Кучанський, О. Ю., Білощицький, А. О. (2015). Selective pattern matching method for time-series forecasting. EasternEuropean Journal of Enterprise Technologies, 6(4(78)), 13-18. URL: https://www.researchgate.net/publication/288323553_Selective_pattern_matching_method_for_time-series_forecasting. DOI: https://doi.org/10.15587/1729-4061.2015.54812
10. Laurinec, Peter and Lucká, Mária. "Clustering-based forecasting method for individual consumers electricity load using time series representations", Open Computer Science, vol. 8, no. 1, 2018, pp. 38-50, doi: https://doi.org/10.1515/comp-2018-0006. DOI: https://doi.org/10.1515/comp-2018-0006
11. Perova I., Bodyanskiy Ye. Adaptive fuzzy clustering based on Manhattan metrics in medical and biological applications. Вісник національного університету «Львівська політехніка», № 826, 2015. – С. 8-12. URL: https://sci.ldubgd.edu.ua/bitstream/123456789/1053/1/Vis_826_Komp-nauky_min.pdf.
12. Song, C., Pei, T., Wang, X., Liu, Y., Ma, J., & Zhou, D. (2022). Dynamic characteristics of the COVID-19 epidemic in China’s major cities. Annals of GIS, 28(4), 445-456, doi: https://doi.org/10.1080/19475683.2022.2026468. DOI: https://doi.org/10.1080/19475683.2022.2026468
13. T. Warren Liao, Clustering of time series data – a survey, Pattern Recognition, Volume 38, Issue 11, 2005, Pages 1857-1874, ISSN 0031-3203, doi: https://doi.org/10.1016/j.patcog.2005.01.025. DOI: https://doi.org/10.1016/j.patcog.2005.01.025
14. Солошенко Е. М., Волкославська В. М., Гутнєв О. Л. Динаміка розповсюдженості та захворюваності на поширені дерматози в Україні і Харківському регіоні за останні 10 років. Дерматологія та венерологія. – 2014. – № 1. – С. 68- 77. URL: http://nbuv.gov.ua/UJRN/dtv_2014_1_11.
Downloads
Published
Issue
Section
License
Copyright (c) 2026 Nataliia Chikina, Iryna Antonova

This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.