跳到主要内容
Documentation
版本:最新版

RAG

概览

rag 是路由局部插件:检索增强生成。

对应 config/plugin/rag/milvus.yaml

主要优势

  • 检索局部在真正需要的路由上。
  • 后端专用检索设置集中在一处。
  • 避免强制每条路由注入文档或工具上下文。

解决什么问题?

部分路由在回答前需要外部文档检索,多数不需要。rag 让已匹配路由执行检索与注入,而不全局化该行为。

何时使用

  • 路由应在最终模型调用前拉取文档或事实
  • 检索应使用 Milvus 或其他显式后端
  • 不同路由需要不同检索设置

配置

routing.decisions[].plugins 下使用:

plugin:
type: rag
configuration:
enabled: true
backend: milvus
top_k: 5
similarity_threshold: 0.78
injection_mode: tool_role
on_failure: warn
backend_config:
collection: docs
reuse_cache_connection: true
content_field: content
metadata_field: metadata