ПОРІВНЯЛЬНИЙ АНАЛІЗ МЕТОДІВ РЕАЛЬНОГО ЧАСУ ДЛЯ РОЗПІЗНАВАННЯ ЖЕСТІВ НА ОСНОВІ MEDIAPIPE, OPENCV ТА YOLOV8

Автор(и)

  • Olha Yeroshenko
  • Vadym Tsipkovskyi

DOI:

https://doi.org/10.26906/SUNZ.2025.4.062

Ключові слова:

розпізнавання жестів, комп'ютерний зір, MediaPipe, OpenCV, YOLOv8, FPS, Detection Rate

Анотація

Предметом дослідження в статті є методи розпізнавання жестів у реальному часі на основі комп'ютерного зору, призначені для інтеграції у системи взаємодії людини з комп'ютером (HCI), зокрема для керування пристроями через веб-камеру. Метою роботи є порівняльний аналіз ефективності трьох сучасних методів – MediaPipe, OpenCV та YOLOv8 – шляхом оцінки їхньої продуктивності за ключовими метриками (FPS та Detection Rate) при виявленні базових жестів. У статті вирішуються такі завдання: ідентифікація впливу зовнішніх факторів (освітлення, фон) на розпізнавання жестів, реалізація алгоритмів для трьох базових жестів (відкрита долоня, вказівний палець вгору та вниз), проведення експериментального тестування та моделювання в середовищі Python. Використовуються такі методи: комп'ютерний зір та обробка зображень (зокрема, сегментація, відстеження ключових точок та об'єктний детекшн); машинне навчання на основі CNN (LeNet, YOLO); аналіз датасетів і метрик продуктивності (precision, recall, mAP); імітаційне моделювання в реальних умовах за допомогою бібліотек mediapipe, opencv-python та ultralytics. Отримано такі результати: проведено порівняльний аналіз методів, де MediaPipe забезпечив найвищу точність (95% Detection Rate), OpenCV – максимальну швидкість (50.7 FPS), а YOLOv8 – баланс для обмежених ресурсів (73% Detection Rate); запропоновано рекомендації щодо гібридних підходів для оптимізації. Висновки: Розроблений порівняльний аналіз методів розпізнавання жестів у реальному часі демонструє, що MediaPipe ефективно усуває перешкоди від мінливого освітлення та фону, досягаючи стабільної точності 95%, тоді як OpenCV оптимізує швидкість обробки до 50.7 FPS. Виконано моделювання в Python з візуалізацією результатів.

Завантаження

Дані завантаження ще не доступні.

Посилання

1. Suresh M., Sinha A., R. P. A. (2019), “Real-Time Hand Gesture Recognition Using Deep Learning”, “IJIIE - International Journal of Innovations & Implementations in Engineering”, Vol. 1, December Edition, pp. 11-15. URL: https://www.ijiie.org/download/IJIIE_2019DEC1003VOL1.pdf

2. Nguyen T.-H., Ngo B.-V., Nguyen T.-N. (2025), “Vision-Based Hand Gesture Recognition Using a YOLOv8n Model for the Navigation of a Smart Wheelchair”, “Electronics”, Vol. 14, № 4, p. 734. URL: https://www.mdpi.com/2079-9292/14/4/734

3. Zengeler N., Kopinski T., Handmann U. (2019), “Hand Gesture Recognition in Automotive Human–Machine Interaction Using Depth Cameras”, “Sensors”, Vol. 19, № 1, p. 59. doi: https://doi.org/10.3390/s19010059

4. Miao, Q., Li, Y., Liu, X., Liu, R. Gesture Recognition: Theory and Applications. Elsevier, 2024. 420 p.

5. Fedorchenko V., Yeroshenko O., Shmatko O., Kolomiitsev O., Omarov M. (2024), “Password hashing methods and algorithms on the .Net platform”, “Advanced Information Systems”, № 8(4), pp. 82–92, doi: https://doi.org/10.20998/2522-9052.2024.4.11

6. Elgendy, M. Deep Learning for Vision Systems. – Manning, 2020. – 480 p. – ISBN: 9781617296192.

Downloads

Опубліковано

2025-12-02

Номер

Розділ

Інформаційні технології