СИСТЕМА ОЦІНКА ПОЗИ ЛЮДИНИ З ВИКОРИСТАННЯМ АЛГОРИТМІВ ГЛИБОКОГО НАВЧАННЯ
DOI:
https://doi.org/10.26906/SUNZ.2023.2.075Ключові слова:
оцінка пози людини, класифікація об'єктів, виявлення об'єктів, згорткові нейронні мережіАнотація
Метою даної роботи є програмна реалізація нейронної мережі, яка може вирішити задачу оцінки пози людини. Завдяки швидкому вдосконаленню моделей нейронної мережі та обчислювальних ресурсів за останні 10 років стало можливим автоматизувати багато процесів, проводити дослідження та покращувати якість життя. Одним із напрямків є комп’ютерний зір: він дозволяє розпізнавати об’єкти, відстежувати рухи, сегментувати зображення, розпізнавати обличчя тощо. Оцінка пози людини є частиною напряму досліджень комп’ютерного зору. Це дозволяє захопити людську позу з відео або зображення та має багато застосувань у медицині, спорті, доповненій реальності, відеоіграх тощо. Таким чином, ціль цієї роботи полягає в тому, щоб знайти та оптимізувати алгоритм, який є відносно точним, для ідентифікації та класифікація суглобів в тілі людини. Для досягнення поставленої мети були вирішені наступні завдання: розглянуто та проаналізовано сучасні методи та технології, які зазвичай використовуються для вирішення задачі оцінки пози людини, використано штучні нейронні мережі як математичний апарат для моделі, програмна реалізація для оцінки пози людини. було розроблено та протестовано, результати моделі проаналізовано та оцінено, результати та висновки сформульовано.Завантаження
Посилання
Krizhevsky, A., Sutskever, I., Hinton, G. E. (2017), "ImageNet classification with deep convolutional neural networks", Communications of the ACM, Vol. 60, No. 6
Alexander Toshev, Christian Szegedy (2014), “DeepPose: Human Pose Estimation via Deep Neural Networks”, DOI:https://doi.org/10.1109/CVPR.2014.214
Alejandro Newell, Kaiyu Yang, Jia Deng (2016), “Stacked Hourglass Networks for Human Pose Estimation”, DOI:https://doi.org/10.48550/arXiv.1603.06937
Bin Xiao, Haiping Wu, Yichen Wei (2018), “Simple Baselines for Human Pose Estimation and Tracking”, DOI:https://doi.org/10.48550/arXiv.1804.06208
Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit, Neil Houlsby (2020), “An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale”, DOI: https://doi.org/10.48550/arXiv.2010.11929
Girdhar, R., Gkioxari, G., Torresani, L., Paluri, M., Tran, D., “Detect-and-track: Efficient pose estimation in videos. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition”
Andriluka, M., Pishchulin, L., Gehler, P., Schiele, B. 20(14) ”2d human pose estimation: New benchmark and state of the art analysis. In: IEEE Conference on Computer Vision and Pattern Recognition “
Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun (2015), "Deep Residual Learning for Image Recognition", DOI:https://doi.org/10.48550/arXiv.1512.03385
Huang, Gao; Liu, Zhuang; Van Der Maaten, Laurens; Weinberger, Kilian Q. (2017). Densely Connected Convolutional Networks. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), doi:10.1109/CVPR.2017.243
Ioffe, S., Szegedy, C., “Batch normalization: Accelerating deep network training by reducing internal covariate shift. In: International conference on machine learning.”
Angjoo Kanazawa, Michael J. Black, David W. Jacobs, and Jitendra Malik, (2018) “End-to-end Recovery of Human Shape and Pose”, DOI: https://doi.org/10.48550/arXiv.1712.06584
COCO2017 dataset, available at https://cocodataset.org/?ref=blog.roboflow.com#download