ТРИРІВНЕВА СИСТЕМА ВЕРИФІКАЦІЇ ГРАФІЧНОГО КОНТЕНТУ НАУКОВИХ ПУБЛІКАЦІЙ НА ОСНОВІ ТОПОЛОГІЧНОГО АНАЛІЗУ ДАНИХ

Автор(и)

  • Maksym Glavchev
  • Yuliia Hlavcheva
  • Maksym Lipchanskyi
  • Oleksii Balenko

DOI:

https://doi.org/10.26906/SUNZ.2026.1.051

Ключові слова:

плагіат графіків, топологічний аналіз даних, персистентні гомології, динамічний зсув часу, наукова доброчесність

Анотація

Об'єкт дослідження ‒ процес верифікації графічного контенту наукових публікацій. Предмет дослідження ‒ методи та алгоритми виявлення плагіату графічної інформації на основі аналізу змісту даних. Метою роботи є розробка та обґрунтування трирівневої системи верифікації графічного контенту наукових публікацій. Результати дослідження. У статті запропоновано новий комплексний метод виявлення плагіату графічної інформації у наукових публікаціях. На відміну від існуючих систем (Proofig, Imagetwin), що виявляють лише візуальні дублікати, запропонований підхід аналізує зміст даних графіків. Метод базується на поєднанні трьох рівнів аналізу: реверс-інжиніринг числових даних з графічних зображень, геометричний аналіз форми кривих за допомогою алгоритму динамічного зсуву часу (DTW) та топологічний аналіз даних (TDA) з використанням персистентних гомологій і відстані Вассерштейна. Наукова новизна полягає у застосуванні топологічних інваріантів для порівняння змісту графічних даних, що забезпечує стійкість до візуальних маніпуляцій: зміни масштабу осей, кольорової схеми, стилю ліній та мови підписів. Розроблено інтегральну метрику оцінки подібності графіків. Ефективність підходу підтверджено на прикладі виявлення замаскованого плагіату.

Завантажити

Дані для завантаження поки недоступні.

Посилання

1. Bik E.M., Casadevall A., Fang F.C. The Prevalence of Inappropriate Image Duplication in Biomedical Research Publications. ‒ mBio, 2016, 7(3), e00809-16. DOI: https://doi.org/10.1128/mBio.00809-16 DOI: https://doi.org/10.1128/mBio.00809-16

2. Bik E.M., Fang F.C., Kullas A.L., Davis R.J., Casadevall A. Analysis and Correction of Inappropriate Image Duplication: the Molecular and Cellular Biology Experience. Mol. Cell. Biol., 2018, 38(20), DOI: https://doi.org/10.1128/MCB.00309-18 DOI: https://doi.org/10.1128/MCB.00309-18

3. Acuna D.E., Brookes P.S., Kording K.P. Bioscience-scale Automated Detection of Figure Element Reuse. BioRxiv, 2018. DOI: https://doi.org/10.1101/269415 DOI: https://doi.org/10.1101/269415

4. Computer vision assisted data extraction from charts using WebPlotDigitizer. URL: https://automeris.io/WebPlotDigitizer

5. Aydin O., Yassikaya M. Y. Validity and Reliability Analysis of the PlotDigitizer Software Program for Data Extraction from Single-Case Graphs. Perspectives on Behavior Science, 2022, Vol. 45, 239–257. DOI: https://doi.org/10.1007/s40614-021-00284-0 DOI: https://doi.org/10.1007/s40614-021-00284-0

6. Sakoe H., Chiba S. Dynamic Programming Algorithm Optimization for Spoken Word Recognition. ‒ IEEE Trans. Acoust. Speech Signal Process., 1978, 26(1), 43–49. DOI: https://doi.org/10.1109/TASSP.1978.1163055 DOI: https://doi.org/10.1109/TASSP.1978.1163055

7. Lee H. S. Application of dynamic time warping algorithm for pattern similarity of gait. J Exerc Rehabil. 2019 Aug 28;15(4):526-530. DOI: https://doi.org/10.12965/jer.1938384.192 DOI: https://doi.org/10.12965/jer.1938384.192

8. Edelsbrunner H., Letscher D., Zomorodian A. Topological Persistence and Simplification. Discrete Comput. Geom., 2002, 28, 511–533. DOI: https://doi.org/10.1007/s00454-002-2885-2 DOI: https://doi.org/10.1007/s00454-002-2885-2

9. Carlsson G. Topology and Data. Bull. Amer. Math. Soc., 2009, 46(2), 255–308. DOI: https://doi.org/10.1090/S0273-0979-09-01249-X DOI: https://doi.org/10.1090/S0273-0979-09-01249-X

10. Ravishanker N., Chen R., An Introduction to Persistent Homology for Time Series. WIREs Comput. Stat., 2021, 13(6), e1548. DOI: https://doi.org/10.1002/wics.1548 DOI: https://doi.org/10.1002/wics.1548

11. Cohen-Steiner D., Edelsbrunner H., Harer J. Stability of Persistence Diagrams. ‒ Discrete Comput. Geom., 2007, 37, 103–120. DOI: https://doi.org/10.1007/s00454-006-1276-5 DOI: https://doi.org/10.1007/s00454-006-1276-5

12. Bauer U. Ripser: Efficient Computation of Vietoris-Rips Persistence Barcodes. ‒ J. Appl. Comput. Topol., 2021, 5, 391–423. DOI: https://doi.org/10.1007/s41468-021-00071-5 DOI: https://doi.org/10.1007/s41468-021-00071-5

13. Chen S., Wang Y. Approximation Algorithms for 1-Wasserstein Distance Between Persistence Diagrams. ‒ Leibniz Int. Proc. Inform. (LIPIcs), 2021, 190, 14:1–14:19. DOI: https://doi.org/10.4230/LIPIcs.SEA.2021.14

14. Sheehy D.R. Linear-Size Approximations to the Vietoris-Rips Filtration. ‒ Discrete Comput. Geom., 2013, 49, 778–796. DOI: https://doi.org/10.1007/s00454-013-9513-1 DOI: https://doi.org/10.1007/s00454-013-9513-1

15. El-Yaagoubi A.B., Chung M.K., Ombao H. Topological Data Analysis for Multivariate Time Series Data. Entropy, 2023, 25(11), 1509. DOI: https://doi.org/10.3390/e25111509 DOI: https://doi.org/10.3390/e25111509

Завантаження

Опубліковано

2026-02-13

Номер

Розділ

Інформаційні технології

Статті цього автора (цих авторів), які найбільше читають