卓普云
#AI

#AI

与「AI」相关的所有文章

91 篇文章
最近更新:2026/2/26

全部文章

无服务器推理(Serverless Inference)是什么?与传统AI推理部署方式全面对比
教程

无服务器推理(Serverless Inference)是什么?与传统AI推理部署方式全面对比

无服务器推理通过API调用AI模型,免管理、按需付费、自动扩展,加速AI应用落地。

2026年2月26日
Claude Opus 4.6 有什么新特性?如何与Claude Code结合开发?
教程

Claude Opus 4.6 有什么新特性?如何与Claude Code结合开发?

探讨是什么让 Claude Opus 4.6 如此备受瞩目,简单扼要地聊一聊使其区别于前代产品的特性,最后通过一个演示Demo,展示如何使用该模型配合 Claude Code 来改进我们自己的一个项目——实时语音翻译器。

2026年2月10日
实时对话 AI 虚拟人是怎么做出来的?语音合成 + 视频生成全流程拆解
教程

实时对话 AI 虚拟人是怎么做出来的?语音合成 + 视频生成全流程拆解

本文通过一个完整实战流程,展示如何结合 character.ai、Qwen3-TTS 与 LTX-2,将文本与语音对话快速转化为音画同步的 AI 虚拟角色视频,详解关键技术原理与部署方法。

2026年2月6日
Moltbot/OpenClaw是什么?如何在云服务器部署 Moltbot/OpenClaw?
教程

Moltbot/OpenClaw是什么?如何在云服务器部署 Moltbot/OpenClaw?

这是一篇在云服务器上部署和配置AI助手Moltbot/Clawdbot的详细教程。

2026年1月29日
AI 下半场:Agent 成分水岭,如何选对 GPU 算力攻克推理成本死穴?
教程

AI 下半场:Agent 成分水岭,如何选对 GPU 算力攻克推理成本死穴?

AI 竞争重心正从模型规模转向智能体(Agent)。针对 Agent 高频推理、长上下文的特征,算力需求已发生质变。本文拆解了从原型到规模化部署的 GPU 选型逻辑。

2026年1月27日
vLLM 推理 GPU 资源配置完全指南——从显存计算到量化与硬件选型
教程

vLLM 推理 GPU 资源配置完全指南——从显存计算到量化与硬件选型

本文系统解析 vLLM 推理运行机制,深入讲清 Prefill 与 Decode 差异、KV Cache 显存增长逻辑及并行开销,结合主流 GPU 架构,对不同模型规模下的显存与性能选型给出清晰参考。

2026年1月23日
海外云 AWS、GCP、Azure 与 DigitalOcean 的核心区别有哪些?
教程

海外云 AWS、GCP、Azure 与 DigitalOcean 的核心区别有哪些?

深度对比 AWS、Azure、GCP 与 DigitalOcean 的性能、带宽成本及 AI 算力差异,为中国出海企业技术负责人提供专业、务实的云服务选型指南。

2026年1月21日
Agent SKill 教程:编写和部署指南
教程

Agent SKill 教程:编写和部署指南

本文系统介绍了 Agent Skills 的概念与实现方式,讲解其文件结构、集成流程与扩展方法,并结合 DigitalOcean Gradient 无服务器推理,展示模块化 Agent 的构建思路与实践路径。

2026年1月19日
DigitalOcean携手Persistent达成战略合作,让 AI 更亲民、更易扩展
新闻

DigitalOcean携手Persistent达成战略合作,让 AI 更亲民、更易扩展

DigitalOcean 与 Persistent 战略合作,通过 SASVA™ 平台与 Gradient AI 云,降低 AI 成本超50%,推动企业高效、安全地规模化应用 AI。

2026年1月19日
技术解码:Character.ai 如何实现大模型实时推理性能 2 倍提升
精选
教程

技术解码:Character.ai 如何实现大模型实时推理性能 2 倍提升

Character.ai与DigitalOcean、AMD深度协同,通过从DP1/TP8/EP8到DP2/TP4/EP4的配置演进及FP8等优化,实现推理吞吐量翻倍,达成千万美元级合作。

2026年1月16日
DigitalOcean 赋能 Character.ai:推理吞吐量翻倍,成本直降 50%
精选
新闻

DigitalOcean 赋能 Character.ai:推理吞吐量翻倍,成本直降 50%

DigitalOcean与AMD合作,通过优化推理云平台使Character.ai的推理吞吐量翻倍,延迟不变的同时令牌成本降低50%。

2026年1月15日
2026 年云 GPU 服务商选型全指南:如何为 AI 工作负载选到真正高性价比的算力平台
精选
教程

2026 年云 GPU 服务商选型全指南:如何为 AI 工作负载选到真正高性价比的算力平台

本文围绕 2026 年云 GPU 市场,结合训练、微调与推理等典型 AI 工作负载,对比主流平台差异,给出兼顾性能、成本与开发体验的选型方法论。

2026年1月6日
长文档也能稳健推理:QwenLong-L1.5 的记忆增强架构与实战部署指南
教程

长文档也能稳健推理:QwenLong-L1.5 的记忆增强架构与实战部署指南

QwenLong-L1.5模型,通过后训练与内存框架解决长上下文推理难题,支持超长文档处理,并推荐在DigitalOcean GPU上部署。

2026年1月4日
想在云上低成本部署高性能Agent?MiniMax-M2 + DigitalOcean实战指南
教程

想在云上低成本部署高性能Agent?MiniMax-M2 + DigitalOcean实战指南

MiniMax-M2是一款高效开源MoE模型,凭借独特的思维链与工具调用能力,在编码和智能体任务上媲美顶级模型,同时大幅降低部署成本。本文详解其核心优势并提供从云服务选择到API调用的完整部署教程。

2025年12月26日
LLM微调后回答不准还花天价?三步调教出你的“高智商”行业AI模型
精选
教程

LLM微调后回答不准还花天价?三步调教出你的“高智商”行业AI模型

将通用大型语言模型通过数据与高效微调技术(如LoRA/QLoRA),转化为高性能、低成本的特定领域专家模型的全流程指南。

2025年12月23日
Mistral 3 模型解析与部署实战:从 Large 3 到 Mini-stral
教程

Mistral 3 模型解析与部署实战:从 Large 3 到 Mini-stral

本文系统介绍 Mistral 3 开源模型家族,解析 Large 3 与 Mini-stral 的能力差异、硬件需求与适用场景,并演示在 DigitalOcean GPU 上的实际部署流程,帮助开发者低成本落地大模型应用。

2025年12月18日
DigitalOcean 远程 MCP 正式上线,让基础设施“开口说话”
产品更新

DigitalOcean 远程 MCP 正式上线,让基础设施“开口说话”

DigitalOcean 现已推出远程 MCP 服务,允许开发者直接通过 AI 助手以自然语言安全管理和操作云端资源,无需本地依赖,配置更简单。

2025年12月10日
开源视频生成新标杆:美团LongCat Video全面解析与实战指南
教程

开源视频生成新标杆:美团LongCat Video全面解析与实战指南

美团LongCat Video是功能强大的开源视频生成模型,支持文本、图像到视频及视频延续,可在配备GPU的服务器上部署运行。

2025年12月3日
AI 训练与游戏出海的新选择:比 AWS EFS 更便宜、更透明的企业级云存储来了
精选
教程

AI 训练与游戏出海的新选择:比 AWS EFS 更便宜、更透明的企业级云存储来了

拒绝隐形收费!DigitalOcean NFS高性能存储,AI与游戏出海的降本增效新方案。

2025年11月25日
教程:利用智源悟界Emu3.5,生成可视化任务指南
教程

教程:利用智源悟界Emu3.5,生成可视化任务指南

Emu3.5 通过文本与图像交替生成,实现视觉引导与叙事生成。本文展示其能力并在 DigitalOcean GPU Droplet 上完整运行示例。

2025年11月21日

相关标签