
Probably 正在打造一种全新形态的 AI 智能体(AI agent)。它专为这样一个世界而设计:用户需要确信 AI 的输出足够可靠,从而能够据此做出关键的战略决策。该公司的诞生源于一个深刻的行业洞察——LLM 经常会凭空编造数字并误读数据,而当企业或组织依靠这些输出做出高风险的战略决策时,其负面后果将会产生滚雪球般的复利效应。为了解决这一痛点,Probably 将 AI 的推理能力与一个确定性的本地计算引擎相结合,在用户看到输出之前,强制 LLM 通过极为严苛的逻辑验证。
与将敏感数据集发送到云端的传统做法不同,该公司将 AI 智能体直接运行在用户的本地机器上,让数据盘(Data Plane)完全封闭在本地,而云端仅作为编排(Orchestration)与协同的通道。数学计算工作被委派给本地机器上经过处理器优化的计算引擎,而不是交给 LLM,这正是使其输出具备“可验证性”的核心所在。
Probably 的控制台(Control Plane)运行在 DigitalOcean 的 AI 原生云(AI-Native Cloud)上,这是一个从底层基础设施到上层推理、专为 AI 工作负载打造的全集成平台。依托该平台,Probably 构建了一套隐私优先的数据分析系统,在实现规模化扩展的同时,完全免去了传统超大规模云厂商(Hyperscalers)的高昂运维复杂度与成本溢价。目前,其控制台运行在 DigitalOcean 核心云层的 App Platform(应用托管平台)上;随着用户量增长,Probably 计划进一步扩展到 Kubernetes 托管服务进行集群编排,并使用 Inference Engine(推理引擎)来运行开源模型负载——而所有这一切,都无需离开他们现有的云平台。
Probably 在 DigitalOcean 上取得的显著成果:
- 基础设施成本降低 25%:相比在亚马逊云(AWS)上的同等硬件配置,支出大幅减少,且完全没有计费网络出流量(Egress)或存储层带来的意外费用。
- 仅用一天半完成 API 架构搭建:从零开始到在 DigitalOcean App Platform 上上线具备生产能力的 API 基础设施,Probably 创始人 Peter Elias 表示,这在 AWS 上是绝不可能实现的效率。
- 每秒处理数万次请求:通过部署在 DigitalOcean 边缘网络上的虚拟机,平稳承载了该公司自主研发的在线评估系统所带来的高并发流量。
专为“本地优先架构”打造的云
Probably 的技术架构非常独特。其 AI 智能体在每个用户的本地机器上运行,而云端则作为跨越公共互联网的协同层。这种模式对云服务商提出了极为严苛且特定的需求:平台必须能够稳定地为来自众多不同用户环境的分布式客户端连接提供服务,并且能够轻松消化突发性的流量峰值,从而让精益的创业团队能够专注于产品开发,而不被底层运维分散精力。
对于一个刻意将数据保留在本地的团队来说,超大规模云厂商会引入不必要的架构复杂度和数据引力(Data Gravity);而新兴的 AI 专有云(Neocloud)或纯推理封装工具又只能覆盖技术栈的一部分,逼得 Probably 必须自己去拼凑其余的组件。
Probably 的创始人 Peter Elias 从一线践行者的视角评估了所有的选择。在创立 Probably 之前,他曾在 Condé Nast 和 Optimizely 长期从事分布式系统和数据基础设施的构建工作。
“我对云服务商和云基础设施有着非常深刻且挑剔的看法,” Peter Elias 说,“只要是市面上存在的云产品,我几乎都用过。”
在大多数平台都落入了两极化的窠臼:要么提供极强的底层能力却伴随着巨大的运维开销,要么提供极简的体验却开出极其昂贵的价格。
“传统上,如果你想构建一个重度依赖云端的产品,你的选择要么是花大量时间去和 AWS 或谷歌云(GCP)死磕,要么是使用像 Heroku 这样的平台,但那又贵得令人发指,” Peter Elias 坦言,“对于我们目前所处的阶段以及可预见的未来,DigitalOcean 是一个极具吸引力的方案,因为它让我们鱼与熊掌兼得。”
DigitalOcean 的 AI 原生云涵盖了从核心计算、网络到推理的完整图景,并统一集成在单个平台中。鉴于 Probably 的特殊架构,其广域网(WAN)的性能显得尤为关键。由于 AI 智能体分布在众多用户的本地环境中运行,仅仅一个会话(Session)就可能对云端的协同层产生巨大的负载。
“如果你同时启动 50 个智能体……单单这一个客户端就可能每分钟产生数百次请求,” Peter Elias 解释道。
随着并发会话随着用户群的扩大而呈指数级增长,云端层必须在不发生性能降级的前提下吸收这些突发流量。此外,从简单基础设施向复杂基础设施平滑演进的能力,也在决策中起到了关键作用。大多数云厂商都会逼着团队做出非此即彼的选择:要么选择极低的上手门槛,要么选择未来处理复杂工作负载的能力。
"DigitalOcean 是唯一一个真正能覆盖完整成长周期的云厂商。在其他任何大厂那里,你都找不到这样一个等效的阶梯——让你既能从最简单的配置轻松起步,又能随着业务发展无缝向上扩展复杂度。这是一种非常独特且极具价值的市场定位," Peter Elias 说。
在 DigitalOcean 上运行控制盘
Probably 将其核心的 API 基础设施托管在 DigitalOcean App Platform 上。这是一个全托管的平台,自动处理部署、弹性扩缩容和底层架构维护,使这个精益的团队能够将全部精力锁死在产品创新上。App Platform 是 AI 智能体编排与计费系统的中枢骨干,具备内置的自动弹性伸缩(Autoscaling)功能,能够完美吞吐 Probably 架构所产生的突发流量;同时,其提供的固定独立 IP(Dedicated IPs)设计,也为连接外部服务提供了安全且合规的保障。
至关重要的一点是,该架构将客户的数据完整地保留在客户自己的机器和内网中。云端 LLM 仅提供推理和任务编排,数据本身绝不会离开用户的设备。发送到外部 LLM API 的请求仅包含规划和推理所必需的脱敏上下文信息。
“DigitalOcean 为我们托管了两个非常核心的系统。一个是计费系统,另一个是针对智能体表现的在线评估系统,” Peter Elias 解释道。
其中,评估系统尤为值得关注。Probably 它是为了应对规模化评估数据智能体行为的独特挑战而从零构建的,而该系统已经证明了自己完全能够承受真实的生产级高压负载。
“我们的智能体评估系统从零打造,旨在攻克数据智能体的评测难题。它通过 DigitalOcean 的边缘网络摄取追踪(Traces)数据。在流量最高峰时,我们曾见证过每秒数万次请求的洪峰,而这些仅仅由几台配置适中的虚拟机就轻松扛了下来。”
业务流量在到达 DigitalOcean 负载均衡器(Load Balancers)之前会先经过一层 CDN 缓存,这种边缘优化的架构在完美吸收突发工作负载的同时,将带宽和算力成本压到了极低。该平台还同时承载了身份验证和用户管理功能,使其成为了公司运营数据的核心记录系统(System of Record)。
成本降低 25%,生产交付速度大幅飙升
自 2025 年中后期启动早期生产试点以来,Probably 见证了客户在平台上活跃使用并给出了令人振奋的反馈。
“我们目前有大约五到六个活跃的试点客户,他们现在非常高频地使用我们的软件,并且正在获得非常出色的业务成效,” Peter Elias 说道。
在这一喜人进展的背后,DigitalOcean 显著降低了成本与运维阻力。这种红利是具体且可量化的。
“当你把 AWS 上的磁盘和网络计费细节加进来对比时,在同等硬件配置下且无需预留实例的前提下,我们使用 DigitalOcean 至少能省下 25% 的成本。在 DigitalOcean,我们拥有固定的成本结构、更高的性价比以及更短的搭建时间,” Peter Elias 表示,“对于绝大多数初创公司而言,这显然是一笔更划算的买卖,因为你本就应该把精力放在打磨产品上,而不是浪费生命去优化 AWS 的账单。”
同样具有颠覆性价值的是走向生产环境的速度。在 DigitalOcean 上搭建 Probably 的首个生产级 API 仅仅花费了一天半的时间。Peter Elias 直言不讳地指出:“这种速度在 AWS 上是根本不可能发生的。”
对于一个正在构建高技术壁垒产品的精英团队来说,客户支持的质量也直接改变了日常的开发体验。
“每当我有最轻微的问题,我可以直接与 DigitalOcean 工程团队的技术专家直接对话,并且总能得到极其专业的解答。这种秒级响应和极具人情味的专属服务——你在那些超级大厂那里是根本奢望不到的。在那些地方,你只会被无情地淹没在工单排队的无底洞里,尤其是作为一家初创公司,那 spiritual 简直是噩梦,” Peter Elias 说。
迈向大模型推理时代
Probably 在积极筹备更广泛的市场准入的同时,仍在不断打磨和精进其系统。随着等待名单(Waitlist)的不断拉长以及对自身架构信心的日益增强,团队预计将更深度地融入 DigitalOcean AI 原生云的生态中——下一步他们将迁移到 DigitalOcean Kubernetes 进行大规模编排,并利用 DigitalOcean Inference Engine(推理引擎)来高效运行开源大模型工作负载,且完全不需要跨越不同的底层云平台。
“随着公司的成长,对我们而言至关重要的一点是拥有多元化的推理算力池。通过 DigitalOcean,我们能够轻松地将开源大模型部署到我们现有的统一平台上,这比在堆积如山的供应商之间玩杂耍要省心得多,” 他解释道。
从更宏观的视角来看,市场机遇无疑是巨大的。大多数企业和机构都极度渴望依赖 AI 智能体来执行关键的数据分析并协助进行高层战略决策。然而现实是,部分企业正逐渐意识到,当前最新一代的前沿大模型在面对事实密集型(Fact-intensive)的任务时并非总是完全可靠,且验证其输出的正确性依旧困难重重。
Probably 正在全力构建这样一个新世界:任何个人或企业都可以直接审视并调用他们最核心的数据,并获得能够彻底信任、足以据此付诸行动的“可验证答案”。而让数据始终锁死在用户自身机器上的设计,则从根本上化解了长期以来阻碍众多企业采纳 AI 数据智能体的隐私合规痛点。想要抵达这一愿景,意味着必须随着采用率的增长而提供完全可预测、可扩展的推理算力支撑,而这,恰恰是 DigitalOcean AI 原生云的王牌绝活。
“选择 DigitalOcean,你将获得无与伦比的性价比。你将获得支撑业务爆发式扩张的弹性、容量和长远的成长空间,” Peter Elias 总结道,“但最重要的一点是,它能为你省下最宝贵资产——时间。”



