0%

LangChain 框架入门:从 Demo 到企业级 AI 应用架构

LangChain 是构建 AI 应用的主流框架之一。它把模型调用、Prompt、工具、检索、Agent 编排等能力封装成组件,让开发者可以更快搭建 AI 应用。

不过,LangChain 很容易让人停留在 Demo 阶段:几行代码能跑,但离企业级可用还有很长距离。本文先介绍核心概念,再补充从 Demo 到生产落地需要关注的架构问题。

1. 核心概念

1.1 Model:模型接口

模型是 AI 应用的推理核心。LangChain 通过统一接口封装 OpenAI、Claude、通义千问、本地模型等不同供应商。

1
2
3
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.2)

企业场景中,模型选择不能只看效果,还要看成本、延迟、数据合规、私有化能力和限流策略。

1.2 Prompt:提示词模板

1
2
3
4
5
from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_template(
"请用架构师视角解释以下技术概念:{topic}"
)

Prompt 模板应该版本化管理,避免散落在代码和聊天记录中。

1.3 Chain:流程编排

Chain 把 Prompt、模型和输出解析串起来。

1
2
chain = prompt | llm
result = chain.invoke({"topic": "RAG"})

简单 Chain 适合固定流程,复杂业务更适合显式编排状态和异常处理。

1.4 Retriever:检索增强

RAG 应用通常需要从知识库检索相关文档,再交给模型生成答案。

1
2
retriever = vectorstore.as_retriever(search_kwargs={"k": 5})
docs = retriever.invoke("企业知识库如何做权限控制?")

检索质量决定 RAG 上限,不能只关注模型本身。

1.5 Agent:工具调用

Agent 可以根据任务选择工具,例如搜索、数据库查询、代码执行、工单系统调用等。

1
2
3
4
5
from langchain.agents import Tool

tools = [
Tool(name="Search", func=search, description="搜索公开资料"),
]

企业 Agent 一定要有权限边界,不能让模型随意调用敏感工具。

2. 一个典型 RAG 应用流程

企业知识库问答通常包含这些步骤:

  1. 文档接入:导入 Markdown、PDF、网页、飞书文档、代码仓库等;
  2. 文档切分:按标题、段落、语义边界切块;
  3. 向量化:生成 Embedding 并写入向量数据库;
  4. 检索:根据用户问题召回相关片段;
  5. 重排:对召回结果进行相关性排序;
  6. 生成:把上下文和问题交给模型;
  7. 引用:返回答案时附带来源;
  8. 评估:记录命中率、幻觉率和用户反馈。

Demo 往往只覆盖第 3-6 步,生产系统还必须补上权限、评估、监控和运营闭环。

3. 企业级最佳实践

3.1 Prompt 和 Chain 要版本化

Prompt 变更会直接影响系统行为,应该像代码一样进入 Git,重要变更走 MR 审查。

3.2 数据权限不能后补

知识库问答最常见的风险是越权回答。文档入库时就要带上权限元数据,检索时基于用户身份过滤。

3.3 做好评估集

至少准备一批标准问题,覆盖高频业务、边界问题、权限问题和容易幻觉的问题。每次 Prompt、模型或检索策略变更后,都跑一遍评估。

3.4 可观测必须前置

记录每次请求的模型、Prompt 版本、召回文档、耗时、token 成本和用户反馈。没有可观测,就无法优化 AI 应用。

3.5 工具调用要最小权限

Agent 能调用工具是优势,也是风险。建议按工具分级:只读工具、低风险写工具、高风险写工具。高风险操作必须有人类确认或审批。

4. LangChain 与 OpenClaw 的关系

LangChain 更偏应用开发框架,适合构建模型调用、RAG、Agent 工具链。OpenClaw 更偏 AI Agent 运行与协作环境,强调多 Agent、技能、记忆、工具、安全边界和长周期任务。

两者可以组合:LangChain 负责某些 AI 应用能力,OpenClaw 负责把这些能力编排进更大的 Agent 工作流中。

例如 PR 审查官可以这样设计:

  • LangChain / 自定义链路负责 diff 摘要、风险识别和报告生成;
  • OpenClaw 管理架构审查 Agent、安全审查 Agent、测试审查 Agent;
  • Jenkins / GitLab 负责触发和回写;
  • 结果进入知识库沉淀。

5. 架构师点评

LangChain 的优势是生态丰富、上手快;风险是抽象层较多,版本变化快,生产系统如果过度依赖框架魔法,后期排障会比较痛苦。

我的建议是:可以用 LangChain 快速验证能力,但企业系统要把核心链路、权限、评估、日志和降级策略掌握在自己手里。框架可以替你省代码,但不能替你负责生产稳定性。

6. 企业落地建议

如果你正在从 0 到 1 做 AI 应用,建议按这个顺序推进:

  1. 先做一个小场景 Demo,验证模型与数据可行性;
  2. 建立 Prompt、文档、评估集和日志规范;
  3. 引入权限过滤和可观测;
  4. 再考虑 Agent 工具调用和多 Agent 协作;
  5. 最后接入 CI/CD、PR 审查和知识库运营。

需要把 LangChain、RAG、OpenClaw 和企业 AI Agent 工作流整合起来,可以查看 企业 AI Agent / AI Coding 落地咨询AI Agent 产品与资料