架构设计不是画几张技术组件图,也不是把流行中间件堆在一起。真正的架构设计,是在业务目标、团队能力、技术约束和成本边界之间做取舍,并把这些取舍变成可以执行、可以演进、可以治理的系统方案。
这篇文章把原来的提纲补全为一套完整方法,适合在新系统设计、老系统重构、企业 AI Agent 平台建设、PR 审查官这类产品化项目中复用。
1. 从业务建模开始
技术架构必须服务业务结构。动手选技术之前,先回答这些问题:
- 核心业务对象是什么?
- 业务对象之间有什么关系?
- 哪些流程是主链路,哪些是支撑流程?
- 哪些规则稳定,哪些规则经常变化?
- 哪些数据必须强一致,哪些可以最终一致?
比如做一个 PR 审查系统,核心对象至少包括:仓库、Pull Request、Diff、审查任务、Agent、审查报告、评论回写记录。只有把这些对象拆清楚,后面的服务边界和数据模型才不会乱。
2. 梳理业务流程
业务流程设计要关注“谁在什么条件下触发什么动作”。建议画出主流程和异常流程:
- 用户或系统触发事件。
- 系统接收并校验输入。
- 核心服务编排任务。
- 下游服务处理并返回结果。
- 结果进入通知、审计或回写流程。
不要只画成功路径。企业系统里,失败、超时、重试、幂等和补偿往往比成功路径更重要。
3. 应用架构设计
应用架构要解决模块边界问题。常见拆分方式包括:
- 按业务领域拆分:用户、订单、审查、报告、通知。
- 按能力层拆分:接入层、编排层、执行层、存储层。
- 按变化频率拆分:稳定核心域和高变化支撑域分离。
我的建议是:早期不要为了“微服务”而微服务。先把领域边界、接口契约和数据归属设计清楚,再决定是单体模块化、微服务还是插件化架构。
4. 技术架构设计
技术选型要围绕约束条件展开:
- 团队熟悉什么技术栈;
- 系统峰值流量和增长预期;
- 数据一致性要求;
- 部署环境是公有云、私有云还是内网;
- 是否要求可观测、可审计、可私有化交付。
对于 AI Agent 类系统,还要额外考虑模型供应商、Prompt 管理、上下文存储、工具权限、任务队列和多 Agent 协作模式。
5. 部署架构设计
部署架构要明确:入口流量如何进来、服务如何发现、配置如何管理、日志如何采集、故障如何隔离。
一个常见的企业部署结构是:
- Nginx / Ingress 作为入口;
- 应用服务运行在 Docker 或 Kubernetes;
- Redis / MQ 处理缓存和异步任务;
- MySQL / PostgreSQL 负责结构化数据;
- 对象存储保存文件和报告;
- Prometheus / Grafana / 日志系统做可观测。
如果是私有化部署,还要提前设计离线镜像、配置模板、安装脚本和版本升级策略。
6. 三高设计:高并发、高可用、高可扩展
三高不是最后补一个“集群部署”就能解决,而是贯穿架构设计全过程。
6.1 高并发
- 入口限流,保护核心服务;
- 异步化处理耗时任务;
- 缓存热点数据;
- 对批量任务做队列削峰。
6.2 高可用
- 服务无状态化;
- 多副本部署;
- 外部依赖设置超时和熔断;
- 关键数据定期备份;
- 发布前后做健康检查。
6.3 高可扩展
- 接口契约稳定;
- 插件化或策略模式承载变化;
- 通过事件机制解耦系统;
- 保持核心域模型清晰。
7. 架构师点评
架构设计最怕两种极端:一种是只谈业务不落技术,另一种是只谈技术不管业务。好的架构方案应该能让业务方看懂价值,让研发团队知道怎么做,让运维团队知道怎么部署和监控。
AI Agent 时代,架构设计会更重要。因为 Agent 可以快速生成代码,但它不会天然理解企业边界、组织协作、数据安全和长期演进。架构师的价值,就是把这些复杂约束转化成清晰的系统结构。
8. 企业落地建议
如果你正在设计企业 AI Agent 平台、AI Coding 流程或 PR 自动审查系统,可以先产出四份核心文档:
- 业务对象与领域模型;
- 核心业务流程与异常流程;
- 应用与部署架构图;
- 发布、监控、回滚和安全治理方案。
需要一起梳理企业级 AI Agent / AI Coding 架构方案,可以查看 企业 AI Agent / AI Coding 落地咨询 或 PR 审查官产品方案。