МОДЕЛЬ РОЗРОБКИ ТЕМАТИЧНИХ ЧАТ-БОТІВ З ВИКОРИСТАННЯМ ПІДХОДУ RAG

Illia Ivasenko; Tetiana Filimonchuk; Stanislav Partyka; Daria Pyvovarova

doi:10.26906/SUNZ.2026.2.110

Автор(и)

Illia Ivasenko
Tetiana Filimonchuk
Stanislav Partyka
Daria Pyvovarova

DOI:

https://doi.org/10.26906/SUNZ.2026.2.110

Ключові слова:

тематичні чат-боти, великі мовні моделі, штучний інтелект, RAG, NLP, попередня обробка, покращення запиту, гібридний пошук, розумна генерація тексту, механізм переранжування, релевантність відповіді, точність контексту

Анотація

Актуальність дослідження зумовлена стрімким розвитком великих мовних моделей (LLM), таких як GPT-4, Llama 3 та Claude, революціонізував сферу обробки природної мови (NLP). LLM демонструють виняткові здібності до генерації зв'язного тексту, узагальнення інформації та ведення діалогу. Однак, при їх застосуванні у спеціалізованих доменах (юриспруденція, медицина, технічна підтримка, корпоративні бази знань) виникають критичні обмеження. По-перше, параметричні знання моделей обмежені датою завершення їх навчання (knowledge cutoff), що унеможливлює роботу з актуальною інформацією. По-друге, моделі схильні до "галюцинацій" – генерації правдоподібних, але фактично невірних тверджень, особливо коли запит стосується вузькоспеціалізованих даних, відсутніх у навчальному наборі. Архітектура RAG стала стандартом де-факто для вирішення цих проблем, поєднуючи генеративні можливості LLM із точним пошуком у зовнішніх базах знань. Проте, практика показує, що "наївна" реалізація RAG (Vanilla RAG) часто є недостатньою для побудови надійних систем. Втрата контексту під час пошуку, нездатність обробити складні запити користувача та відсутність механізмів верифікації призводять до нерелевантних відповідей. У зв'язку з цим, актуальною науково-практичною задачею є не просто імплементація RAG, а розробка та дослідження методів оптимізації кожного етапу генерації. Об’єктом дослідження є процеси інформаційного пошуку та генерації природної мови в інтелектуальних діалогових системах, побудованих на базі великих мовних моделей. Предметом дослідження є методи та алгоритми підвищення точності, релевантності та контекстуальної узгодженості відповідей у системах архітектури RAG, а саме гібридний пошук, покращення запитів користувача. Висновки. Практична цінність дослідження полягає у створенні моделі архітектури, яку можна адаптувати для будь-якої предметної області (від технічної документації до нормативно-правових баз), забезпечуючи при цьому вищу метричну точність відповідей порівняно з базовими рішеннями.

Завантажити

Дані для завантаження поки недоступні.

Посилання

1. Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. arXiv preprint arXiv:2005.11401v4. 2021. doi: https://doi.org/10.48550/arXiv.2005.11401

2. Kelvin Guu, Kenton Lee, Zora Tung, Panupong Pasupat, Ming-Wei Chang. REALM: Retrieval-Augmented Language Model Pre-Training. arXiv preprint arXiv:2002.08909v1. 2020. doi: https://doi.org/10.48550/arXiv.2002.08909

3. Vladimir Karpukhin, Barlas Oguz, Sewon Min, Patrick Lewis, Ledell Wu, Sergey Edunov, Danqi Chen, Wen-tau Yih. Dense Passage Retrieval for Open-Domain Question Answering. In Proceedings of the 2020 Conference on Empirical Methods in Natural Language Processing (EMNLP), 2020, pp. 6769-6781. doi: https://doi.org/10.18653/v1/2020.emnlp-main.550

4. Omar Khattab, Matei Zaharia. Efficient and Effective Passage Search via Contextualized Late Interaction over BERT. SIGIR'20: Proceedings of the 43rd International ACM SIGIR Conference on Research and Development in Information Retrieval. 2020, p. 39-48. doi: https://doi.org/10.1145/3397271.3401075

5. Gautier Izacard, Edouard Grave. Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering. In Proceedings of the 16th Conference of the European Chapter of the Association for Computational Linguistics: Main Volume. 2021, pages 874-880. doi: https://doi.org/10.18653/v1/2021.eacl-main.74

6. Sebastian Borgeaud, Arthur Mensch, Jordan Hoffmann, Trevor Cai, Eliza Rutherford, Katie Millican, George van den Driessche, Jean-Baptiste Lespiau, Bogdan Damoc, Aidan Clark. Improving language models by retrieving from trillions of tokens. arXiv preprint arXiv:2112.04426v3. 2022. doi: https://doi.org/10.48550/arXiv.2112.04426

7. Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. arXiv preprint arXiv:2201.11903v6. 2023. doi: https://doi.org/10.48550/arXiv.2201.11903