МЕТОДИКИ АВТОМАТИЧНОГО РОЗПІЗНАВАННЯ СКЛАДНИХ ОБ’ЄКТІВ ЗА ФОРМОЮ

Автор(и)

  • N. Yermilova
  • Y. Zourab
  • R. Iermilov

DOI:

https://doi.org/10.26906/SUNZ.2023.4.080

Ключові слова:

розпізнавання, класифікація об’єктів, коефіцієнт еліптичності, коефіцієнт складності форми, точність вимірювання

Анотація

Аналіз літературних джерел показує, що необхідність розпізнавання як великих, так і дрібних об’єктів є важливим напрямком розвитку сучасних систем технічного зору роботів та інших технічних засобів автоматизації, які повинні вміти за виміряними значеннями ознак розпізнати будь-який об'єкт, що потрапив у поле їхнього зору, віднести його до деякого класу, прийняти рішення та видати команду маніпуляторам робота. У статті розглядаються підходи до розпізнавання з наступною класифікацією дрібних об’єктів за такими ознаками, як коефіцієнт еліптичності та коефіцієнт складності форми. Виділивши ознаки та їх комбінації для ідентифікації подібних об'єктів, можна натренувати модель машинного навчання на розпізнавання необхідних типів закономірностей. Проведене порівняння методик вимірювання площ проекцій об’єктів, форма яких є близькою до прямокутної, об’єктів круглої форми, та об’єктів, які представляють собою довгу витягнуту фігуру складної форми. Зроблено оцінку точності вимірювання площі та периметрів складних фігур, визначені похибки вибраних значень радіусів малих об’єктів залежно від кроку квантування. Розглянута можливість розпізнавання об’єктів з використанням традиційних методів обробки зображень або сучасних мереж глибокого навчання: відкритої бібліотеки для роботи з алгоритмами комп’ютерного зору, машинним навчанням та обробкой зображень OpenCV, найновіших моделей розпізнавання SSD, R-FCN, Faster R-CNN, Mask R-CNN та YOLO, в архітектурі яких можна побачити багато покращень та досягнень у методологіях виявлення об'єктів. Показані переваги використання популярної моделі розпізнавання Faster R-CNN, що являє собою комбінацію між моделями RPN і Fast R-CNN, для швидкого розпізнавання дрібних об’єктів складної форми. Зроблено висновок, що автоматичні системи розпізнавання, які працюють за даною методикою, дозволяють досліджувати різноманітні об’єкти, відрізняються достатньо високою швидкодією, але у зв’язку зі складністю їх використання в реальному часі виправдане лише у тих випадках, коли ці об’єкти мають складну форму й не можуть бути розпізнані та класифіковані звичайними більш простими методами та засобами

Завантаження

Дані завантаження ще не доступні.

Посилання

Система технічного зору: особливості, завдання, принципи роботи, основні компоненти [Електронний ресурс]- Режим доступу: http://bigbro.com.ua/sistematehnichnogo-zoru-osoblivosti-zavdannya-printsipi-roboti-osnovni-komponenti/.

Антонюк В.С., Вислоух С.П., Катрук О.В. Класифікаціяі розпізнання образів при автоматизованому проектуванні технологічних процесів. // Надійність інструменту та оптимізація технологічних систем. Збірник наукових праць. – Краматорськ–Київ, Вип. № 23, 2008. – С. 176–182.

David Forsyth - Computer Vision: A Modern Approach. – 2004. – 928 с.

Multi-scale Template Matching using Python and OpenCV by Adrian Rosebrock [Електронний ресурс]- Режим доступу: https://www.pyimagesearch.com/2015/01/26/multi-scale-template-matching-usingpython-opencv/.

Hastie T. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. – 2nd ed, 2009р. – 746 с.

Довбиш А. С. Основи теорії розпізнавання образів : навч. посіб. : у 2 ч. / А. С. Довбиш, І. В. Шелехов. – Суми : Сумський державний університет, 2015. – Ч. 1. – 109с.

Зайченко Ю. П. Основи проектування інтелектуальних систем: навчальний посібник / Ю. П. Зайченко. – К. : 106 Видавничий Дім «Слово», 2004. – 352 с.

Hastie T. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. – 2nd ed. / T. Hastie, R. Tibshirani, J. Friedman. – Springer-Verlag, 2009. – 746 p.

Han J. Data mining: concepts and techniques. J. Han, M. Kamber, J. Pei. – Morgan Kaufmann / Elsevier, 2012. – 744 p.

What is OpenCV? The Complete Guide [Електронний ресурс] - Режим доступу: https://viso.ai/computer-vision/opencv/.

The PASCAL Visual Object Classes Homepage [Електронний ресурс] - Режим доступу: http://host.robots.ox.ac.uk/pascal/VOC/.

What is the COCO Dataset? [Електронний ресурс] - Режим доступу: https://viso.ai/computer-vision/coco-dataset/.

Downloads

Опубліковано

2023-12-12

Номер

Розділ

Інформаційні технології

Статті цього автора (авторів), які найбільше читають