如果你的企业也面临"有几百台终端要部署 AI、但生产环境不能联网"的困境,这篇复盘也许能帮你少走几个月弯路。
2026 年,我们完成了一个颇有挑战的项目——江苏某集团型制造企业(以下简称"江苏制造"),要在 完全离线的生产环境 中,为 500 个终端 部署企业级 AI 能力,从启动到上线仅 72 天。
本文从选型决策、部署架构、实施落地三个维度完整复盘,也记录了我们踩过的坑。
项目背景:为什么要在离线环境部署 AI?
江苏制造是一家典型的集团型制造企业,旗下 3 个工厂、1 个研发中心,员工总数超 3,000 人。核心痛点有三:
数据安全红线:生产网络与互联网物理隔离,所有数据不得出域。这是制造型企业的硬性合规要求,也是项目最大的约束条件。
IT 环境复杂:500 个终端分布在 4 个厂区,操作系统版本不一(Windows 7/10/11 混用),部分工控机配置较低。
业务连续性要求高:生产线不可中断,部署窗口期极短。任何需要长时间停机的方案都不被接受。
数据来源:环曜团队项目档案,2026 年 Q2。
选型决策:为什么选择企业级环曜 CLI 本地化部署方案
在项目启动阶段,我们评估了三种主流方案:
| 方案 | 离线支持 | 部署复杂度 | 终端兼容性 | 总成本(预估) |
|---|---|---|---|---|
| 云端 API 方案 | ❌ 不支持 | 低 | 好 | 中 |
| 开源自建方案(LangChain + vLLM) | ✅ 支持 | 高 | 中 | 低(隐性成本高) |
| 企业级环曜 CLI 本地化部署 | ✅ 支持 | 中 | 好 | 中 |
云端方案因离线环境约束直接被排除。开源自建方案虽然软件免费,但团队评估后发现:需要至少 2 名全职运维工程师,且终端兼容性问题需要大量自研适配工作,3 年总拥有成本(TCO)反而不低。
最终选择企业级环曜 CLI 本地化部署,核心考量:
- 完全离线部署:所有模型和推理均在本地完成,无需互联网连接
- 终端兼容性好:支持 Windows/Linux 混合环境,最低配置要求低
- 72 天上线承诺:有标准化部署工具链,无需从零搭建
关于选型维度的更详细方法论,可参阅Agent+企业微信:私域AI Agent的本地化落地实践中的部署架构对比。
部署架构:500 终端的离线部署设计
整个部署架构分为三层:
第一层:中心推理服务器(工厂级)
每个工厂部署一台推理服务器(4×A100 80GB + 256GB 内存),预装企业级环曜 CLI 工具链。服务器负责所有 AI 推理任务,终端仅作为客户端调用。
第二层:离线分发网络
通过工厂内部局域网(不连互联网)分发模型更新和推理结果。环曜 Claw(企业级本地化 AI 智能体执行网关)作为中间层,管理终端与服务端的通信。
第三层:终端客户端
500 个终端安装轻量级客户端,通过局域网调用中心服务器的推理能力。客户端支持离线缓存模式——即使网络临时中断,终端仍可基于本地缓存继续工作。
关于 AI Agent 在企业系统集成中的应用,可进一步了解长三角企业AI+企业系统集成:ERP/CRM智能化升级方案中的四步集成方法。
落地过程:72 天全流程时间线
| 阶段 | 时间 | 关键动作 | 踩坑记录 |
|---|---|---|---|
| 环境评估 | 第1-10天 | 终端盘点、网络拓扑测绘、硬件采购 | 部分工控机只有4GB内存,需降级模型版本 |
| 部署方案设计 | 第11-20天 | 确定三层架构、设计离线分发策略 | 工厂间网络延迟超出预期,需增加本地缓存层 |
| 中心服务器部署 | 第21-35天 | 3个工厂推理服务器安装、环曜CLI配置 | 某工厂电力不稳定导致服务器多次重启,需加UPS |
| 终端客户端安装 | 第36-50天 | 500终端逐台安装、兼容性测试 | Windows 7 终端需手动安装 VC++ 运行库 |
| 系统联调 | 第51-60天 | 全链路测试、压力测试、容灾演练 | 并发高峰时推理响应超时,需优化负载均衡 |
| 试运行 | 第61-68天 | 100终端试点、收集反馈、迭代优化 | 工人反馈界面不够直观,调整交互设计 |
| 正式上线 | 第69-72天 | 全量上线、运维交接、文档交付 | — |
关键数据:部署前后对比
| 指标 | 部署前 | 部署后 | 变化 |
|---|---|---|---|
| 产线质检效率 | 人工抽检 5% | AI 辅助全检 100% | 提升 20 倍 |
| 设备故障预警 | 人工巡检,发现时已停机 | AI 预测,提前 2-4 小时预警 | 减少停机 67% |
| 技术人员响应时间 | 平均 45 分钟 | 平均 8 分钟 | 缩短 82% |
| 新员工培训周期 | 3 个月 | 2 周(AI 辅助问答) | 缩短 83% |
数据来源:江苏制造项目上线后 30 天统计数据,环曜团队整理。
踩坑复盘:最值得注意的 3 个教训
教训一:低估了老旧终端的兼容性成本
项目启动时估计终端适配需要 5 天,实际花了 15 天。部分 Windows 7 系统缺少现代运行库,需要逐台手动安装。建议:在项目初期就做全面的终端兼容性扫描,预留更多缓冲时间。
教训二:工厂间网络环境差异大
本以为都是内网就没问题,但实际测试发现两个工厂间的网络延迟超过 200ms,远超预期。解决:在每个工厂增加本地缓存层,减少跨厂通信。
教训三:一线操作员的接受度是关键
初期忽略了终端用户的培训,上线第一周收到大量负面反馈。解决:在第 61-68 天的试运行阶段,安排了 3 轮现场培训,并制作了纸质版操作手册——离线环境无法扫码看视频教程。
常见问题 FAQ
Q:离线环境下的模型更新怎么做?
通过 U 盘或内部文件服务器分发更新包。环曜 CLI 支持离线升级,管理员下载更新包后在内网分发即可,终端会自动检测并更新。
Q:500 终端并发时,推理服务器的压力能承受吗?
实测 4×A100 80GB 可支持约 200 终端同时发起推理请求(平均响应 < 2s)。超出时自动排队,可通过增加节点扩展。
Q:如果中心服务器宕机了怎么办?
终端客户端支持本地缓存模式,在服务器恢复前可基于缓存继续运行核心功能。同时部署了主备两套推理服务器。
Q:这种方案比云端方案贵多少?
硬件一次性投入较高(约 30-50 万),但无持续 API 调用费用。3 年 TCO 与云端方案基本持平,且数据安全性和可控性更高。企业级环曜 CLI 本地化部署方案在制造行业的全场景一体化支持让后续维护成本显著降低。
Q:其他制造企业可以复制这个方案吗?
完全可以。架构设计已标准化,部署流程已形成 SOP。不同规模的企业可通过调整推理服务器配置和终端数量灵活适配。