
DigitalOcean 基于 NVIDIA GPU 如何为 Workato 降低 67% AI 推理成本
一文详解如何针对 Workato 的长上下文、高并发工作负载,实现了每 GPU 吞吐量提升 67%、端到端延迟降低 79%、首 Token 时间(TTFT)降低 77%,同时使用的 GPU 数量减少了一半,推理成本降低了 67%。
DigitalOcean Gradient AI 推理云平台原生集成 LlamaIndex
DigitalOcean Gradient AI平台原生集成LlamaIndex,通过两个PyPI包简化RAG应用开发,让开发者快速构建生产级AI应用。
面向 AI 推理的算力升级:AMD MI350X GPU Droplets云服务器上线
搭载 AMD MI350X 的 GPU Droplets上线,提升 AI 推理性能与吞吐,兼顾低延迟与成本可控。
Claude Opus 4.6 上线 DigitalOcean:百万上下文,一键调用
Claude Opus 4.6 通过 DigitalOcean Serverless Inference 正式上线,提供百万级上下文与 Agentic 能力,帮助团队在统一云环境中高效构建、部署并扩展 AI 推理应用。
构建企业级 AI 系统,只调用 DeepSeek、MiniMax、Kimi 之类的 API 够吗?
仅调用大模型API不足以构建企业级AI系统,还需要知识库管理、Agent编排、可观测性等系统工程能力,DigitalOcean Gradient AI提供了一站式托管解决方案。
GPU对比:MI350X、MI325X、MI300X、H200、H100
五大旗舰 GPU 终极对决:NVIDIA H100/H200 与 AMD MI300X/MI325X/MI350X,谁才是你的性价比之王?
无服务器推理(Serverless Inference)是什么?与传统AI推理部署方式全面对比
无服务器推理通过API调用AI模型,免管理、按需付费、自动扩展,加速AI应用落地。
DigitalOcean 基于 NVIDIA GPU 如何为 Workato 降低 67% AI 推理成本
一文详解如何针对 Workato 的长上下文、高并发工作负载,实现了每 GPU 吞吐量提升 67%、端到端延迟降低 79%、首 Token 时间(TTFT)降低 77%,同时使用的 GPU 数量减少了一半,推理成本降低了 67%。
没有 SRE 的创业团队,如何用 DigitalOcean 搭建一整套儿童课程在线平台
三位创始人打造儿童活动平台 Camperoni,在没有 SRE 的情况下,通过 DigitalOcean 托管服务快速构建并稳定运营整个平台。
DigitalOcean携手Persistent达成战略合作,让 AI 更亲民、更易扩展
DigitalOcean 与 Persistent 战略合作,通过 SASVA™ 平台与 Gradient AI 云,降低 AI 成本超50%,推动企业高效、安全地规模化应用 AI。
DigitalOcean 赋能 Character.ai:推理吞吐量翻倍,成本直降 50%
DigitalOcean与AMD合作,通过优化推理云平台使Character.ai的推理吞吐量翻倍,延迟不变的同时令牌成本降低50%。












