卓普云
新闻精选

DigitalOcean 赋能 Character.ai:推理吞吐量翻倍,成本直降 50%

DigitalOcean与AMD合作,通过优化推理云平台使Character.ai的推理吞吐量翻倍,延迟不变的同时令牌成本降低50%。

2026年1月15日
DigitalOcean 赋能 Character.ai:推理吞吐量翻倍,成本直降 50%

DigitalOcean 云平台(NYSE: DOCN) 凭借其推理云平台(Inference Cloud Platform)以及与 AMD 的软硬件深度协作,成功助力全球领先的 AI 娱乐平台 Character.ai 实现生产环境推理吞吐量的 ​2 倍增长​。Character.ai 运行着目前市场上需求最苛刻的生产推理任务,每日处理的查询量高达 10 亿次。

Character.ai 是全球领先的 AI 娱乐平台,拥有约 ​2,000 万用户​。Character.ai 的应用具有高容量、高并发且对延迟极度敏感的特点,其底层通过混合使用私有模型和开源模型来驱动。在将相关工作负载迁移至 DigitalOcean 推理云平台后,Character.ai 在严守延迟标准的同时,实现了请求吞吐量的飞跃。与标准的通用 GPU 基础设施相比,这一转型不仅将​**单 Token 成本降低了 50%**​,还为终端用户显著扩展了可用容量。

Character.ai 合作伙伴关系高级副总裁 David Brinker 表示,这一成果远超预期:“我们对 DigitalOcean 在性能、延迟和规模方面提出了极其严苛的要求。而 DigitalOcean 提供了极其稳定的性能,释放了更高的持续吞吐量并优化了经济模型,这为我们平台的持续增长提供了直接动力。”

这一里程碑式的进展也标志着 DigitalOcean 在服务 Character.ai 等大规模 AI 客户方面的势头愈发强劲,进一步支撑了平台的全球扩张及更丰富的多模态体验。

软硬一体化:深度协同的性能优化

DigitalOcean 与 Character.ai 及 AMD 紧密合作,部署了专为推理任务优化的 ​AMD Instinct™ MI300X 和 MI325X GPU ​云服务器​。在 DigitalOcean 的平台中,GPU 服务器不再只是被视为通用的硬件资源,而是通过其平台集成的“硬件感知调度”和“优化推理运行时”,将每个节点的持续性能榨取到了极致。

AMD 在其开放的端到端 AI 软件栈 ROCm™ 上投入了巨资。通过三方的深度协作,各团队针对 Character.ai 在 DigitalOcean 平台上运行的 ​AMD Instinct™ MI300X 及 MI325X GPU​,对 ROCm 配合 vLLM、AITER(AMD 专为 Transformer 工作负载打造的优化框架)以及部署配置进行了专项调优,最终实现了吞吐量的翻倍。

这种性能飞跃在处理超大规模 ​MoE​​​ 模型​(例如 Qwen3-235B )时表现尤为卓越。通过 DigitalOcean 独特的分布式并行策略,单服务器的请求密度提升了近 91%,这意味着客户可以用更少的硬件支撑更多的并发用户。客户不仅可以节省成本,还能提升产品的表现。

AMD 人工智能高级副总裁 Vamsi Boppana 指出:“当平台侧与芯片侧团队深度联手解决实际生产痛点时,所迸发的潜力是巨大的。通过结合 AMD Instinct GPU、开放的 ROCm 软件栈以及 DigitalOcean 的平台级优化,我们正在为运行大规模、低延迟的生产级 AI 工作负载打造一个高性价比且可扩展的基石。”

在实际调优过程中,DigitalOcean 的工程师精准权衡了延迟、吞吐量与并发量。这些优化手段在相同延迟约束下将吞吐量提升了 2 倍,显著降低了客户的总体拥有成本(TCO)。

重定义大规模 AI 推理:不仅是算力,更是成果

这一成功案例体现了 DigitalOcean 的核心理念:GPU 固然重要,但最终的业务产出(Outcomes)才是一切。 DigitalOcean 致力于设计并运营能为客户提供极致稳定性与性能的系统。

事实上,DigitalOcean ​不仅提供 GPU 算力​,更提供端到端的交付体验。其 Kubernetes 托管服务(DOKS) 预装了所有必需的驱动与优化组件,结合​DigitalOceanNFS​​**(Managed Network File Storage)​,可使大模型的加载速度提升了 ​15%**​,确保企业能够实现“即时部署、即刻扩展”。

不同于其它仅强调“GPU 供应”的传统云厂商,DigitalOcean 的推理云平台专为 AI 生产环境而生。它提供了一个“硬件 + 软件统一范式”,通过底层的统筹编排与系统级调优,为大规模生产级 AI 负载带来了卓越的性价比、可观测性和操作便利性。

DigitalOcean 首席执行官 Paddy Srinivasan 表示:“Character.ai 运行着全球最具挑战性的实时推理任务之一。这次合作有力地证明了,当顶尖硬件遇上专为推理设计的平台时,会产生怎样的化学反应。我们不只是在提供运行更快的模型,我们还在让大规模 AI 应用的运营变得更简单、更经济。”

Character.ai 的部署模式反映了 AI 基础设施评估标准的行业转型:随着推理规模的扩大,客户正逐渐将性能的可预测性、操作的极简性以及成本效率置于原始硬件参数之上。

首页/新闻/DigitalOcean 赋能 Character.ai:推理吞吐量翻倍,成本直降 50%

相关文章

DigitalOcean 助力 ACE Studio:推理延迟降40%,训练效率翻倍
精选
新闻

DigitalOcean 助力 ACE Studio:推理延迟降40%,训练效率翻倍

基于 DigitalOcean 与 AMD GPU,ACE Studio 将推理延迟降低40%、训练周期缩短一半,实现更高效稳定的音乐生成体验。

2026年4月28日
DigitalOcean 助力 Bright Data 构建高稳定数据平台
新闻

DigitalOcean 助力 Bright Data 构建高稳定数据平台

依托 DigitalOcean 的高带宽与稳定云基础设施,Bright Data 实现全球数据采集能力提升与业务规模化增长,持续优化平台性能与效率

2026年4月27日
当所有人都在讨论 AI 工具时,我们已经用 AI 跑通了一家公司
精选
新闻

当所有人都在讨论 AI 工具时,我们已经用 AI 跑通了一家公司

AI在演进,人与公司也在随之进化。

2026年3月31日