
如今的 AI 编程智能体(Coding agents)普遍存在一个严重的成本超支问题。无论你是设计系统架构还是编写单行文档字符串(Docstring),每一次请求往往都会被路由到同一个昂贵的前沿模型(Frontier model)上,比如 Claude。其后果就是:产生了不必要的 Token 消耗、推高了推理成本,并且应用对任务的复杂性或预算限制几乎毫无感知。
这种高昂的成本源于模型使用上“一刀切”的做法——在不需要高强度推理能力的琐碎任务上,依然动用了高溢价的前沿模型。在多智能体工作流中,协调者/编排器(Agent Orchestrators)需要将工作指派给专门的子智能体(Subagents),这种缺乏鉴别能力的分流频繁导致成本失控以及不透明的失败模式。在没有智能路由的情况下,开发者在探索性的构建阶段中,实质上会被迫被死死锁定在某家闭源模型大厂,硬吞高昂的 API 账单。
目前已进入公开预览(Public Preview)阶段的 DigitalOcean 推理路由器(Inference Router),正是为了解决这一问题而构建。它能够将请求动态路由到最适合该工作的模型上。作为 DigitalOcean AI 原生云的一部分,它为开发者提供了一种统一的方式,来跨模型控制、优化和评估 AI 推理。而从今天开始,你只需短短几秒钟,就可以通过开源 AI 编程智能体 OpenCode 来访问它。
什么是推理路由器?
推理路由器是工程师们习以为常的“自动模式”范式,但它对至关重要的权衡因素——延迟、成本和输出质量——进行了刻意的控制。推理路由器不再将你的编程智能体静态地指向单一模型,而是能够分析每一次请求,并将其路由到最适合该特定任务的模型。它挑选的不是当前最强大的模型,而是最合适的模型。正是这种区别,在不牺牲你所期望的输出质量的前提下,成为了实现真正成本节省的底层驱动力。 要使用 DigitalOcean 的推理路由器:在路由器目录中创建一个推理路由器——选择一个预设或通过 API、UI 构建自定义路由器。无需 GPU 管理,也无需运行基础设施。在任何兼容 OpenAI 的 API 调用中,只需通过设置 "model": "router:your-router-name" 即可投入使用。
OpenCode 迎来了哪些改变
通过拥抱一个简单的理念:开发者不应该被锁定在单一的模型服务商中,OpenCode 已经成为 GitHub 上最受欢迎的 AI 编程脚手架之一,赢得了超过 160,000 颗星。它的崛起表明了市场对独立于服务商(Provider agnostic)的 AI 使用场景的需求。在 Deploy 2026 大会上,推理路由器的核心工程师 Tyler Gillam 在舞台上现场演示了我们的集成,清晰地展示了 OpenCode 和推理路由器如何协同工作,以此来实现实时的智能模型选择决策。如果你想在亲自动手前观看该演示,本文底部附有完整录像的链接。 在过去,将 DigitalOcean 模型集成到 OpenCode 中意味着必须手动编辑你的 opencode.json,纯靠手工添加每一个模型。鉴于新模型发布的速度之快,这个列表在几周内就会过时。因此,我们构建了原生的 OpenCode 集成,开箱即用式地支持推理路由器和 DigitalOcean 无服务器推理(Serverless Inference)模型。 现在你可以执行以下步骤:
- 启动 OpenCode(桌面端、网页端或终端 TUI)并运行
/connect - 选择 使用 DigitalOcean 登录(Login with DigitalOcean)
- 你的推理路由器将显示在“模型选择(Model Selection)”标签页中
就是这么简单。你正在直接接入一个路由层,它已经开始根据你的具体需求,通过我们量身定制的软件工程预设(Software Engineering preset),来帮你做出成本与质量之间的权衡决策。
编程智能体之外
本次集成是一项更广泛努力的一部分,旨在将 DigitalOcean 的推理引擎(Inference Engine)引入开发者已经在使用的一流工具中,同时继续对开源和上游贡献进行投资。OpenCode 正是这一方向的一个典型示例。 我们的目标是让智能、具备成本意识的模型路由成为编程智能体的默认行为,而不是需要你手动配置并只能祈祷最好结果的繁琐选项。随着开源(OSS)模型生态的持续改进,路由智能的价值将变得越来越高,而不是降低。前沿模型(Frontier)与“足够好(Good enough)”模型之间的差距正在快速缩小,善于利用路由技术的开发者将在期望的质量和成本两方面持续保持领先。 如果你正在使用 OpenCode,今天就去尝试一下 /connect 吧。如果你想深入了解什么是推理路由器以及它是如何工作的,下方提供了完整的文档资源。
推理路由器相关资源:


