Рамки RAG (Retrieval-Augmented Generation) привлекли внимание благодаря своей способности улучшать большие языковые модели (LLM), интегрируя внешние источники знаний. Это помогает решить такие проблемы, как галлюцинации и устаревшая информация. Однако традиционные подходы RAG часто опираются на поверхностную релевантность документов, упуская глубоко заложенные идеи в текстах или информацию, распределённую по нескольким источникам.
Эти методы также ограничены в применении, в основном они подходят для простых задач ответа на вопросы и с трудом справляются с более сложными приложениями, такими как синтез идей из разнообразного качественного данных или анализ сложного юридического или бизнес-контента.
Хотя более ранние модели RAG улучшили точность в таких задачах, как суммирование и ответы на вопросы в открытой области, их механизмы извлечения информации не обладали достаточной глубиной для извлечения тонких нюансов. Новые вариации, такие как Iter-RetGen и self-RAG, пытаются управлять многоэтапным рассуждением, но не очень хорошо подходят для неразложимых задач, подобных тем, что изучаются здесь.
Параллельные усилия по извлечению идей показали, что LLM могут эффективно извлекать детальную информацию, специфичную для контекста, из неструктурированного текста. Продвинутые методы, включая модели на основе трансформеров, такие как OpenIE6, усовершенствовали способность выявлять критические детали. LLM всё чаще применяются в областях извлечения ключевых фраз и интеллектуального анализа документов, демонстрируя свою ценность за пределами базовых задач извлечения информации.
Исследователи из Megagon Labs представили Insight-RAG — новую структуру, которая улучшает традиционный подход Retrieval-Augmented Generation, добавляя промежуточный этап извлечения идей. Вместо того чтобы полагаться на поверхностное извлечение документов, Insight-RAG сначала использует LLM для определения ключевых информационных потребностей запроса. Затем LLM, адаптированная к конкретной области, извлекает соответствующий контент, согласованный с этими идеями, и генерирует окончательный, насыщенный контекстом ответ.
Оценка на двух наборах научных статей показала, что Insight-RAG значительно превосходит стандартные методы RAG, особенно в задачах, связанных со скрытой или многоисточниковой информацией и рекомендацией цитирования. Эти результаты подчёркивают его более широкую применимость за пределами стандартных задач ответа на вопросы.
Insight-RAG состоит из трёх основных компонентов, предназначенных для устранения недостатков традиционных методов RAG за счёт включения среднего этапа, ориентированного на извлечение идей, специфичных для задачи.
1. **Анализатор идей** изучает входной запрос, чтобы определить его основные информационные потребности, действуя как фильтр для выделения релевантного контекста.
2. **Извлекатель идей** использует адаптированную к области LLM, а именно постоянно предварительно обученную модель Llama-3.2 3B, для извлечения подробного контента, соответствующего этим идеям.
3. **Генератор ответов** объединяет исходный запрос с извлечёнными идеями, используя другую LLM для генерации контекстно насыщенного и точного вывода.
Для оценки Insight-RAG исследователи построили три эталона, используя аннотации из наборов данных AAN и OC, сосредоточив внимание на различных проблемах, связанных с генерацией, усиленной извлечением информации. Эксперименты показали, что Insight-RAG последовательно превосходит традиционный RAG, особенно в обработке тонкой или распределённой информации, при этом модели DeepSeek-R1 и Llama-3.3 показывают высокие результаты по всем бенчмаркам.
В заключение, Insight-RAG — это новая структура, которая улучшает традиционный RAG, добавляя промежуточный этап, ориентированный на извлечение ключевых идей. Этот метод решает ограничения стандартного RAG, такие как пропуск скрытых деталей, интеграция информации из нескольких документов и обработка задач, выходящих за рамки ответов на вопросы. Insight-RAG сначала использует большие языковые модели для понимания основных потребностей запроса, а затем извлекает контент, соответствующий этим идеям. Оценка на научных наборах данных (AAN и OC) показала, что он последовательно превосходит традиционные методы RAG. Будущие направления включают расширение применения в таких областях, как юриспруденция и медицина, введение иерархического извлечения идей, обработку мультимодальных данных, включение экспертного ввода и изучение переноса идей между доменами.
Добавить комментарий