ЗНАЧУЩІСТЬ ОБЧИСЛЮВАЛЬНИХ СИСТЕМ ІЗ МАСОВИМ ПАРАЛЕЛІЗМОМ ПРИ ОБРОБЦІ СКАНОВАНИХ ДОКУМЕНТІВ
Ключові слова:
система, обробка, текст, обчислювач, графічний процесор, багатопоточність, зображення, передобробка, прискорення, інформаційний ресурс, сховище
Анотація
У роботі запропоновано узагальнена модель системи класифікації сканованих документів, яка являє організаційно-функціональний, технологічний і програмно-технічний комплекс для класифікації або категоризації документу за ключовими словами, які визначаються частотним словником. Актуальність теми дослідження полягає у скороченні часу впорядкування нових інформаційних ресурсів, що надходять до сховища, завдяки збільшенню швидкості роботи методів покращення якості вихідного зображення безпосередньо перед обробкою та аналізом тексту. Аналіз результатів довів ефективність та доцільність використання обчислювачів із масовим паралелізмом для виконання таких задач, як шумопригнічення та зміна значення колірних каналів вихідного повнокольорового зображення, досягаючи прискорення до 53,51% у порівнянні із використанням обчислювального ресурсу центрального процесору.Завантаження
Дані про завантаження поки що недоступні.
Посилання
1. Rusyn B., Lytvyn V., Vysotska V., Emmerich M., Pohreliuk L. (2019) The Virtual Library System Design and Development.In: Shakhovska N., Medykovskyy M. (eds) Advances in Intelligent Systems and Computing III. CSIT 2018. Advances in Intelligent Systems and Computing, vol 871. Springer, Cham. https://doi.org/10.1007/978-3-030-01069-0_24.
2. Cao, G., Liang, M., & Li, X. (2018). How to make the library smart? The conceptualization of the smart library. Electron. Libr., 36, 811-825.
3. T. Hermawan and R. W. Wardhani, "Implementation AES with digital signature for secure web-based electronic archive,"2016 8th International Conference on Information Technology and Electrical Engineering (ICITEE), 2016, pp. 1-6, doi: 10.1109/ICITEED.2016.7863268.
4. Y. Wang, "Design and Implementation of Electronic Archives Information Management Under Cloud Computing Platform,"2019 11th International Conference on Measuring Technology and Mechatronics Automation (ICMTMA), 2019, pp. 154-158, doi: 10.1109/ICMTMA.2019.00041.
5. Y. Yang and J. Shieh, "Data Warehouse Applications in Libraries -- The Development of Library Management Reports,"2016 5th IIAI International Congress on Advanced Applied Informatics (IIAI-AAI), 2016, pp. 88-91, doi: 10.1109/IIAIAAI. 2016.129.
6. S. Savanur and K. S. Shreedhara, "Automated data validation for data warehouse testing," 2016 International Conference on Electrical, Electronics, Communication, Computer and Optimization Techniques (ICEECCOT), 2016, pp. 223-226, doi: 10.1109/ICEECCOT.2016.7955219.
7. Barkovska, O., Pyvovarova, D., Kholiev, V., Ivashchenko, H., & Rosinskyi, D. (2021). Information object storage model with accelerated text processing methods. In CEUR Workshop Proceedings (pp. 286-299).
8. Barkovska, O., Kholiev, V., Pyvovarova, D., Ivaschenko, G., & Rosinskiy, D. (2021). INTERNATIONAL SYSTEM OF KNOWLEDGE EXCHANGE FOR YOUNG SCIENTISTS. Advanced Information Systems-Sučasnì ìnformacìjnì sistemi, 5(1), 69-74.
9. M. Lan, C. L. Tan, J. Su and Y. Lu, "Supervised and Traditional Term Weighting Methods for Automatic Text Categorization," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 31, no. 4, pp. 721-735, April 2009, doi: 10.1109/TPAMI.2008.110.
10. Sang-Bum Kim, Kyoung-Soo Han, Hae-Chang Rim and Sung Hyon Myaeng, "Some Effective Techniques for Naive Bayes Text Classification," in IEEE Transactions on Knowledge and Data Engineering, vol. 18, no. 11, pp. 1457-1466, Nov. 2006, doi: 10.1109/TKDE.2006.180.
11. Yefeng Zheng, Huiping Li and D. Doermann, "Machine printed text and handwriting identification in noisy document images," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, no. 3, pp. 337-353, March 2004, doi: 10.1109/TPAMI.2004.1262324.
12. R. Smith, "An Overview of the Tesseract OCR Engine," Ninth International Conference on Document Analysis and Recognition (ICDAR 2007), 2007, pp. 629-633, doi: 10.1109/ICDAR.2007.4376991.
13. Y. -M. Su, H. -W. Peng, K. -W. Huang and C. -S. Yang, "Image processing technology for text recognition," 2019 International Conference on Technologies and Applications of Artificial Intelligence (TAAI), 2019, pp. 1-5, doi: 10.1109/TAAI48200.2019.8959877.
14. Olesia Barkovska, Oleg Mikhal , Daria Pyvovarova , Oleksii Liashenko , Vladyslav Diachenko and Maxim Volk, Local Concurrency in Text Block Search Tasks, International Journal of Emerging Trends in Engineering Research. - Volume 8. No. 3, March 2020. – P.690-694.
15. Barkovska О., Pyvovarova D. and Serdechnyi V., Pryskorenyj alghorytm poshuku sliv-obraziv u teksti z adaptyvnoju dekompozycijeju vykhidnykh danykh. [Accelerated word-image search algorithm in text with adaptive decomposition of input data]. Systemy upravlinnja, navighaciji ta zv'jazku 4 (56), 28-34. (in Ukrainian)
2. Cao, G., Liang, M., & Li, X. (2018). How to make the library smart? The conceptualization of the smart library. Electron. Libr., 36, 811-825.
3. T. Hermawan and R. W. Wardhani, "Implementation AES with digital signature for secure web-based electronic archive,"2016 8th International Conference on Information Technology and Electrical Engineering (ICITEE), 2016, pp. 1-6, doi: 10.1109/ICITEED.2016.7863268.
4. Y. Wang, "Design and Implementation of Electronic Archives Information Management Under Cloud Computing Platform,"2019 11th International Conference on Measuring Technology and Mechatronics Automation (ICMTMA), 2019, pp. 154-158, doi: 10.1109/ICMTMA.2019.00041.
5. Y. Yang and J. Shieh, "Data Warehouse Applications in Libraries -- The Development of Library Management Reports,"2016 5th IIAI International Congress on Advanced Applied Informatics (IIAI-AAI), 2016, pp. 88-91, doi: 10.1109/IIAIAAI. 2016.129.
6. S. Savanur and K. S. Shreedhara, "Automated data validation for data warehouse testing," 2016 International Conference on Electrical, Electronics, Communication, Computer and Optimization Techniques (ICEECCOT), 2016, pp. 223-226, doi: 10.1109/ICEECCOT.2016.7955219.
7. Barkovska, O., Pyvovarova, D., Kholiev, V., Ivashchenko, H., & Rosinskyi, D. (2021). Information object storage model with accelerated text processing methods. In CEUR Workshop Proceedings (pp. 286-299).
8. Barkovska, O., Kholiev, V., Pyvovarova, D., Ivaschenko, G., & Rosinskiy, D. (2021). INTERNATIONAL SYSTEM OF KNOWLEDGE EXCHANGE FOR YOUNG SCIENTISTS. Advanced Information Systems-Sučasnì ìnformacìjnì sistemi, 5(1), 69-74.
9. M. Lan, C. L. Tan, J. Su and Y. Lu, "Supervised and Traditional Term Weighting Methods for Automatic Text Categorization," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 31, no. 4, pp. 721-735, April 2009, doi: 10.1109/TPAMI.2008.110.
10. Sang-Bum Kim, Kyoung-Soo Han, Hae-Chang Rim and Sung Hyon Myaeng, "Some Effective Techniques for Naive Bayes Text Classification," in IEEE Transactions on Knowledge and Data Engineering, vol. 18, no. 11, pp. 1457-1466, Nov. 2006, doi: 10.1109/TKDE.2006.180.
11. Yefeng Zheng, Huiping Li and D. Doermann, "Machine printed text and handwriting identification in noisy document images," in IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 26, no. 3, pp. 337-353, March 2004, doi: 10.1109/TPAMI.2004.1262324.
12. R. Smith, "An Overview of the Tesseract OCR Engine," Ninth International Conference on Document Analysis and Recognition (ICDAR 2007), 2007, pp. 629-633, doi: 10.1109/ICDAR.2007.4376991.
13. Y. -M. Su, H. -W. Peng, K. -W. Huang and C. -S. Yang, "Image processing technology for text recognition," 2019 International Conference on Technologies and Applications of Artificial Intelligence (TAAI), 2019, pp. 1-5, doi: 10.1109/TAAI48200.2019.8959877.
14. Olesia Barkovska, Oleg Mikhal , Daria Pyvovarova , Oleksii Liashenko , Vladyslav Diachenko and Maxim Volk, Local Concurrency in Text Block Search Tasks, International Journal of Emerging Trends in Engineering Research. - Volume 8. No. 3, March 2020. – P.690-694.
15. Barkovska О., Pyvovarova D. and Serdechnyi V., Pryskorenyj alghorytm poshuku sliv-obraziv u teksti z adaptyvnoju dekompozycijeju vykhidnykh danykh. [Accelerated word-image search algorithm in text with adaptive decomposition of input data]. Systemy upravlinnja, navighaciji ta zv'jazku 4 (56), 28-34. (in Ukrainian)
Опубліковано
2022-04-01
Як цитувати
Barkovska O. Значущість обчислювальних систем із масовим паралелізмом при обробці сканованих документів / O. Barkovska, V. Kholiev, D. Polikanov // Системи управління, навігації та зв’язку. Збірник наукових праць. – Полтава: ПНТУ, 2022. – Т. 1 (67). – С. 43-47. – doi:https://doi.org/10.26906/SUNZ.2022.1.043.
Розділ
Інформаційні технології
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.