ДОСЛІДЖЕННЯ ВІДКРИТИХ НАБОРІВ ДАНИХ ВЕБ-РЕСУРСІВ У КОНТЕКСТІ ЗАСТОСУВАННЯ ЇХ ДЛЯ ТЕСТУВАННЯ РЕКОМЕНДАЦІЙНИХ СИСТЕМ

Автор(и)

  • D. Shynhalov
  • Ye. Meleshko
  • V. Bosko

DOI:

https://doi.org/10.26906/SUNZ.2019.4.110

Ключові слова:

рекомендаційні системи, тестування, аналіз даних, відкриті набори даних, цифровий маркетинг

Анотація

Предметом вивчення у статті є процес тестування методів побудови рекомендаційних систем на основі відкритих наборів даних у мережі Інтернет. Метою є дослідження відкритих наборів даних веб-ресурсів у контексті застосування їх для тестування різних методів побудови рекомендаційних систем. Завдання: дослідити сучасні вебплатформи з відкритими наборами даних та можливість застосування їх даних для тестування якості роботи різних рекомендаційних систем. Отримані такі результати: Розглянуто найбільш популярні веб-платформи з відкритими наборами різнотипних мережевих даних. Здійснено порівняльний аналіз цих платформ з точки зору наявності вільного доступу до завантаження даних, їх функціональності та територіальної приналежності, формату даних та зручності для подальшого використання для машинного навчання, а також можливості застосування для тестування рекомендаційних систем. Також проведено оцінку актуальності даних, що зберігаються у репозиторіях з вільним доступом та наявності їх оновлення з часом. Висновки. Досліджено веб-платформи, що містять відкриті набори даних, які можна використати для тестування рекомендаційних систем. Основними перевагами більшості платформ є підтримка сучасних форматів даних та умовно вільний або вільний доступ. Серед недоліків розглянутих платформ слід зазначити недостатню структурованість деяких наборів даних, зокрема текстових, що значно обмежує їх застосування для тестування методів контентної фільтрації. Окрім того, одним з факторів, що обмежує використання відкритих наборів даних є їхня актуальність, тому що деякі набори, що зберігаються на платформах, є застарілими та не оновлюються. Усі розглянуті набори даних можуть бути застосовані для дослідницьких цілей та тестування роботи рекомендаційних систем.

Завантажити

Дані для завантаження поки недоступні.

Посилання

Linden G., Smith B. and York J. (2003), “Amazon.com recommendations: Item-to-item collaborative filtering”, Internet Computing, IEEE 7, 1, pp. 76–80. DOI: https://doi.org/10.1109/MIC.2003.1167344

Jannach D., Gedikli F., Karakaya Z., Juwig O. (2012) Recommending Hotels based on Multi-Dimensional Customer Ratings. In: Fuchs M., Ricci F., Cantoni L. (eds) Information and Communication Technologies in Tourism 2012. Springer, Vienna, pp 320-331. DOI: https://doi.org/10.1007/978-3-7091-1142-0_28

Bennet J. and Lanning S. (2007) “The Netflix Prize”, Proceedings of KDD cup and workshop, available at : http://www.netflixprize.com (last accessed May 31, 2019).

Aggarwal C. (2017). Recommender Systems: The Textbook, New York: Springer. 498 p.

Adomavicius G. and Tuzhilin A. (2005), “Towards the Next Generation of Recommender Systems” A Survey of the State-ofthe-Art and Possible Extensions, IEEE Transactions on Knowledge and Data Engineering, No. 17, pp. 634–749. DOI: https://doi.org/10.1109/TKDE.2005.99

Son Le Hoang (2016). Dealing with the new user cold-start problem in recommender systems: A comparative review. Information Systems, 58, 87-104. DOI: https://doi.org/10.1016/j.is.2014.10.001

Bernardi L., Kamps J., Kiseleva J, Müller M. (2015). The Continuous Cold Start Problem in e-Commerce Recommender Systems. CoRR abs/1508.01177.

Чалий С.Ф., Лещинський В.О., Лещинська І.О. (2018). Моделювання контексту в рекомендаційних системах. Проблеми інформаційних технологій, 1(023), 21-26.

Braunhofer M. (2014). Hybrid Solution of the Cold-Start Problem in Context-Aware Recommender Systems. UMAP 2014: User Modeling, Adaptation, and Personalization, 484-489. DOI: https://doi.org/10.1007/978-3-319-08786-3_44

Koren, Y. (2009). Collaborative Filtering with Temporal Dynamics. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 447-456. DOI: https://doi.org/10.1145/1557019.1557072

Xiang L., Yuan Q. (2010). Temporal Recommendation on Graphs via Long-and Short-term Prefence Fusion. KDD’10 of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 723-732. DOI: https://doi.org/10.1145/1835804.1835896

Elahi M., Ricci F., Rubens N. (2016). A survey of active learning in collaborative filtering recommender systems. Computer Science Review, 20, 29-50. DOI: https://doi.org/10.1016/j.cosrev.2016.05.002

Chalyi S., Pribylnova I. (2019). The method of constructing recommendations online on the temporal dynamics of user interests using multilayer graph. EUREKA: Physics and Engineering, 3, 13-19. DOI: https://doi.org/10.21303/2461-4262.2019.00894

Luo C., Cai X. (2014). Self-training Temporal Dynamics Collaborative Filtering. PAKDD’14, 461-472. DOI: https://doi.org/10.1007/978-3-319-06608-0_38

Zhu Y., Lin J., He S., Wang B., Guan Z., Liu H., and Cai D. (2018). Addressing the item cold-start problem by attributedriven active learning,” arXiv preprint arXiv:1805.09023.

Kalynychenko O., Chalyi S., Bodyanskiy Y., Golian V., Golian N. (2013). Implementation of search mechanism for implicit dependences in process mining. 2013 IEEE 7th International Conference on Intelligent Data Acquisition and Advanced Computing Systems (IDAACS). Institute of Electrical and Electronics Engineers (IEEE). DOI: 10.1109/IDAACS.2013.6662657 DOI: https://doi.org/10.1109/IDAACS.2013.6662657

Levykin V., Chala O. (2018). Development of a method of probabilistic inference of sequences of business process activities to support business process management. Eastern-European Journal of Enterprise Technologies, 5/3(95), 16-24. DOI: 10.15587/1729-4061.2018.142664. DOI: https://doi.org/10.15587/1729-4061.2018.142664

Levykin V., Chala O. (2018). Method of determining weights of temporal rules in markov logic network for building knowledge base in information control system. EUREKA: Physics and Engineering, 5(18), 3-10. DOI: https://doi.org/10.21303/2461-4262.2018.00713

Завантаження

Опубліковано

2019-09-11

Номер

Розділ

Інформаційні технології

Статті цього автора (цих авторів), які найбільше читають

1 2 > >>