24-第四节 生成集成与系统整合
第四节 生成集成与系统整合
Boss要打完喽!在最后一节来学习一下如何实现智能的生成集成模块,以及将所有模块整合成一个完整的RAG系统。
flowchart LR
%% 生成集成与系统整合流程
INPUT[📖 检索结果] --> ROUTE{🎯 查询路由}
%% 查询路由分支
ROUTE -->|list| LIST_QUERY[📋 列表查询]
ROUTE -->|detail| DETAIL_QUERY[📖 详细查询]
ROUTE -->|general| GENERAL_QUERY[ℹ️ 一般查询]
%% 查询重写处理
LIST_QUERY --> KEEP[📝 保持原查询]
DETAIL_QUERY --> KEEP
GENERAL_QUERY --> REWRITE[🔄 查询重写]
%% 父子文档处理
KEEP --> PARENT[📚 获取父文档]
REWRITE --> PARENT
PARENT --> DEDUP[🧠 智能去重排序]
%% 生成模式路由
DEDUP --> GEN_ROUTE{🎨 生成模式路由}
GEN_ROUTE -->|list| LIST_GEN[📋 列表生成模式]
GEN_ROUTE -->|detail| DETAIL_GEN[📝 分步指导模式]
GEN_ROUTE -->|general| BASIC_GEN[💬 基础回答模式]
%% 最终输出
LIST_GEN --> OUTPUT[✨ 返回结果]
DETAIL_GEN --> OUTPUT
BASIC_GEN --> OUTPUT
%% 查询路由详细流程
subgraph RouteProcess [查询路由过程]
R1[🔍 分析查询类型]
R2[📊 判断用户意图]
R3[🎯 选择处理策略]
R1 --> R2 --> R3
end
%% 查询重写详细流程
subgraph RewriteProcess [查询重写过程]
W1[📝 分析查询模糊度]
W2[🔧 优化查询表达]
W3[✅ 输出重写结果]
W1 --> W2 --> W3
end
%% 生成模式详细流程
subgraph GenerationProcess [多模式生成过程]
G1[📋 简洁列表输出]
G2[📝 结构化详细指导]
G3[💬 基础信息回答]
G1 --> G2 --> G3
end
%% 系统整合流程
subgraph SystemProcess [系统整合过程]
SYS1[🔧 模块初始化]
SYS2[📚 知识库构建]
SYS3[🔄 交互式问答]
SYS1 --> SYS2 --> SYS3
end
%% 连接子流程
ROUTE -.-> RouteProcess
REWRITE -.-> RewriteProcess
GEN_ROUTE -.-> GenerationProcess
OUTPUT -.-> SystemProcess
%% 样式定义
classDef routing fill:#f3e5f5,stroke:#4a148c,stroke-width:2px
classDef rewrite fill:#e8eaf6,stroke:#3f51b5,stroke-width:2px
classDef generation fill:#fff3e0,stroke:#e65100,stroke-width:2px
classDef system fill:#e3f2fd,stroke:#0277bd,stroke-width:2px
classDef subprocess fill:#f1f8e9,stroke:#33691e,stroke-width:2px
classDef output fill:#fce4ec,stroke:#880e4f,stroke-width:2px
%% 应用样式
class ROUTE,LIST_QUERY,DETAIL_QUERY,GENERAL_QUERY,GEN_ROUTE routing
class KEEP,REWRITE rewrite
class LIST_GEN,DETAIL_GEN,BASIC_GEN generation
class PARENT,DEDUP system
class RouteProcess,RewriteProcess,GenerationProcess,SystemProcess subprocess
class INPUT,OUTPUT output
一、生成集成模块
生成集成模块是整个RAG系统的"大脑",负责理解用户意图、路由查询类型,并生成高质量的回答。
1.1 设计思路
智能查询路由:根据用户查询自动判断是列表查询、详细查询还是一般查询,选择最适合的生成策略。
查询重写优化:对模糊不清的查询进行智能重写,提升检索效果。比如将"做菜"重写为"简单易做的家常菜谱"。
多模式生成: - 列表模式:适用于推荐类查询,返回简洁的菜品列表 - 详细模式:适用于制作类查询,提供分步骤的详细指导 - 基础模式:适用于一般性问题,提供常规回答
上面说到的两种主要方法可以回顾 查询重构与分发
1.2 类结构设计
class GenerationIntegrationModule:
"""生成集成模块 - 负责LLM集成和回答生成"""
def __init__(self, model_name: str = "kimi-k2-0711-preview",
temperature: float = 0.1, max_tokens: int = 2048):
self.model_name = model_name
self.temperature = temperature
self.max_tokens = max_tokens
self.llm = None
self.setup_llm()
temperature: 生成温度,控制回答的创造性max_tokens: 最大生成长度llm: Moonshot Chat模型实例
1.3 查询路由实现
def query_router(self, query: str) -> str:
"""查询路由 - 根据查询类型选择不同的处理方式"""
prompt = ChatPromptTemplate.from_template("""
根据用户的问题,将其分类为以下三种类型之一:
1. 'list' - 用户想要获取菜品列表或推荐,只需要菜名
例如:推荐几个素菜、有什么川菜、给我3个简单的菜
2. 'detail' - 用户想要具体的制作方法或详细信息
例如:宫保鸡丁怎么做、制作步骤、需要什么食材
3. 'general' - 其他一般性问题
例如:什么是川菜、制作技巧、营养价值
请只返回分类结果:list、detail 或 general
用户问题: {query}
分类结果:""")
# ... (LCEL链式调用)
return result
查询路由是整个系统的关键,决定了后续的处理流程。通过LLM自动判断查询意图,比简单的关键词匹配更准确。
1.4 查询重写优化
def query_rewrite(self, query: str) -> str:
"""智能查询重写 - 让大模型判断是否需要重写查询"""
# 使用LLM分析查询是否需要重写
# 具体明确的查询(如"宫保鸡丁怎么做")保持原样
# 模糊查询(如"做菜"、"推荐个菜")进行重写优化
# ... (提示词设计和LCEL链式调用)
return response
查询重写能够将模糊的用户输入转换为更适合检索的查询,显著提升系统的实用性。重写规则包括:保持原意不变、增加相关烹饪术语、优先推荐简单易做的菜品。
1.5 多模式生成
列表模式生成:
def generate_list_answer(self, query: str, context_docs: List[Document]) -> str:
"""生成列表式回答 - 适用于推荐类查询"""
# 提取菜品名称
dish_names = []
for doc in context_docs:
dish_name = doc.metadata.get('dish_name', '未知菜品')
if dish_name not in dish_names:
dish_names.append(dish_name)
# 构建简洁的列表回答
if len(dish_names) <= 3:
return f"为您推荐以下菜品:\n" + "\n".join([f"{i+1}. {name}" for i, name in enumerate(dish_names)])
# ... (其他情况处理)
详细模式生成:
def generate_step_by_step_answer(self, query: str, context_docs: List[Document]) -> str:
"""生成分步骤回答"""
# 使用结构化提示词,包含:
# - 🥘 菜品介绍
# - 🛒 所需食材
# - 👨🍳 制作步骤
# - 💡 制作技巧
# ... (提示词设计和LCEL链式调用)
return response
详细模式使用结构化的提示词设计,让LLM能够生成格式规范、内容丰富的分步骤指导,重点突出实用性和可操作性。
二、系统整合
主程序负责协调各个模块,实现完整的RAG流程:数据准备 → 索引构建 → 检索优化 → 生成集成。同时提供了索引缓存、交互式问答等实用功能。
2.1 主系统类设计
class RecipeRAGSystem:
"""食谱RAG系统主类"""
def __init__(self, config: RAGConfig = None):
self.config = config or DEFAULT_CONFIG
self.data_module = None
self.index_module = None
self.retrieval_module = None
self.generation_module = None
# 检查数据路径和API密钥
if not Path(self.config.data_path).exists():
raise FileNotFoundError(f"数据路径不存在: {self.config.data_path}")
if not os.getenv("MOONSHOT_API_KEY"):
raise ValueError("请设置 MOONSHOT_API_KEY 环境变量")
主系统类负责协调所有模块,确保系统的完整性和一致性。
2.2 系统初始化流程
def initialize_system(self):
"""初始化所有模块"""
# 1. 初始化数据准备模块
self.data_module = DataPreparationModule(self.config.data_path)
# 2. 初始化索引构建模块
self.index_module = IndexConstructionModule(
model_name=self.config.embedding_model,
index_save_path=self.config.index_save_path
)
# 3. 初始化生成集成模块
self.generation_module = GenerationIntegrationModule(
model_name=self.config.llm_model,
temperature=self.config.temperature,
max_tokens=self.config.max_tokens
)
初始化过程按照依赖关系有序进行,保证每个模块都能正确设置。
2.3 知识库构建流程
def build_knowledge_base(self):
"""构建知识库"""
# 1. 尝试加载已保存的索引
vectorstore = self.index_module.load_index()
if vectorstore is not None:
# 加载已有索引,但仍需要文档和分块用于检索模块
self.data_module.load_documents()
chunks = self.data_module.chunk_documents()
else:
# 构建新索引的完整流程
self.data_module.load_documents()
chunks = self.data_module.chunk_documents()
vectorstore = self.index_module.build_vector_index(chunks)
self.index_module.save_index()
# 初始化检索优化模块
self.retrieval_module = RetrievalOptimizationModule(vectorstore, chunks)
这个流程运用了之前设计的索引缓存机制,能够大幅提升系统启动速度。
2.4 智能问答流程
def ask_question(self, question: str, stream: bool = False):
"""回答用户问题"""
# 1. 查询路由
route_type = self.generation_module.query_router(question)
# 2. 智能查询重写(根据路由类型)
if route_type == 'list':
rewritten_query = question # 列表查询保持原样
else:
rewritten_query = self.generation_module.query_rewrite(question)
# 3. 检索相关子块
relevant_chunks = self.retrieval_module.hybrid_search(rewritten_query, top_k=self.config.top_k)
# 4. 根据路由类型选择回答方式
if route_type == 'list':
# 列表查询:返回菜品名称列表
relevant_docs = self.data_module.get_parent_documents(relevant_chunks)
return self.generation_module.generate_list_answer(question, relevant_docs)
else:
# 详细查询:获取完整文档并生成详细回答
relevant_docs = self.data_module.get_parent_documents(relevant_chunks)
if route_type == "detail":
# 详细查询使用分步指导模式
return self.generation_module.generate_step_by_step_answer(question, relevant_docs)
else:
# 一般查询使用基础回答模式
return self.generation_module.generate_basic_answer(question, relevant_docs)
这部分展示了程序执行流程:智能路由 → 查询优化 → 混合检索 → 父子文档处理 → 多模式生成。
2.5 实际使用示例
2.5.1 不同查询类型的效果
列表查询示例:
用户问题: "推荐几道简单的素菜"
查询类型: list
生成结果:
为您推荐以下菜品:
1. 西红柿炒鸡蛋
2. 土豆丝
3. 青椒炒豆腐
详细查询示例:
用户问题: "宫保鸡丁怎么做?"
查询类型: detail
生成结果:
## 🥘 菜品介绍
宫保鸡丁是一道经典川菜,口感麻辣鲜香...
## 🛒 所需食材
- 鸡胸肉 300g
- 花生米 100g
- 干辣椒 10个
...
## 👨🍳 制作步骤
1. 鸡肉切丁,用料酒和生抽腌制15分钟
2. 热锅下油,爆炒花生米至微黄盛起
...
2.5.2 交互式问答
系统提供了完整的命令行交互界面,启动时会显示"尝尝咸淡RAG系统"的欢迎信息:
def run_interactive(self):
"""运行交互式问答"""
print("=" * 60)
print("🍽️ 尝尝咸淡RAG系统 - 交互式问答 🍽️")
print("=" * 60)
print("💡 解决您的选择困难症,告别'今天吃什么'的世纪难题!")
# 初始化系统和构建知识库
self.initialize_system()
self.build_knowledge_base()
while True:
user_input = input("\n您的问题: ").strip()
if user_input.lower() in ['退出', 'quit', 'exit']:
break
# 询问是否使用流式输出
stream_choice = input("是否使用流式输出? (y/n, 默认y): ").strip().lower()
use_stream = stream_choice != 'n'
if use_stream:
# 流式输出,实时显示生成过程
for chunk in self.ask_question(user_input, stream=True):
print(chunk, end="", flush=True)
else:
# 普通输出
answer = self.ask_question(user_input, stream=False)
print(answer)
运行效果示例:
============================================================
🍽️ 尝尝咸淡RAG系统 - 交互式问答 🍽️
============================================================
💡 解决您的选择困难症,告别'今天吃什么'的世纪难题!
✅ 成功加载已保存的向量索引!
✅ 系统初始化完成!
您的问题: 推荐几道简单的素菜
是否使用流式输出? (y/n, 默认y): y
为您推荐以下素菜:
1. 西红柿炒鸡蛋 - 经典家常菜,简单易做
2. 土豆丝 - 爽脆可口,适合新手
3. 青椒炒豆腐 - 营养丰富,制作简单
流式输出的实现通过LangChain的chain.stream()方法,它会返回一个生成器,每次yield一个文本片段。在交互式界面中,通过print(chunk, end="", flush=True)实时输出每个片段,end=""避免换行,flush=True确保立即显示,从而实现逐字逐句的流式效果。
三、优化方向
虽然当前系统已经具备了完整的RAG功能,但仍有许多优化空间。未来的优化可以聚焦于几个关键方向的融合与深化:可以通过 集成图数据库 将食谱数据构建为知识图谱,来揭示食材、菜品与烹饪方法间的复杂关联,进而支持复杂关系查询(如“和鸡肉搭配的食材有哪些”)、发掘潜在的食材组合并实现基于图的智能推荐。还可以 融合多模态数据,结合菜品图片等视觉信息,利用多模态模型进行图文联合检索,不仅能支持“这是什么菜”的视觉搜索,还可以通过图像识别食材来推荐相关菜谱。或者通过 增强专业知识,集成营养成分数据库、烹饪技巧知识图谱以及食材替换规则库等外部知识源,系统将能提供精准的营养分析、专业的烹饪指导,并灵活适应用户的饮食过敏或个人偏好。