
Bright Data 是一家行业领先的 Web 数据平台,帮助全球企业以快速、规模化的方式采集、索引并结构化公开的互联网数据。Bright Data 团队致力于让数据更易获取,帮助人们高效获取所需信息,从而支持关键的战略和运营决策。无论是《财富》500 强企业、学术机构,还是中小型公司,都依赖 Bright Data 以高效、可靠且灵活的方式获取关键的公开网络数据,用于研究、监测和分析,从而做出更优决策。
Bright Data 成立于 2014 年,旨在解决日益增长的 Web 数据需求。互联网或许是全球最大的数据库,但其数据高度割裂。例如,在一个地区可访问的数据,在另一个地区可能无法获取。为了解决这一问题,Bright Data 推出了住宅 IP 网络,使相关的数据采集请求能够被识别为来自真实用户的访问——这一在当时具有开创性的方式,使各类企业能够在全球范围内访问任意公开的 Web 数据。公司在成立之初便选择与 DigitalOcean 合作,并一直将其作为云基础设施的重要组成部分。如今,随着业务快速增长,Bright Data 已升级至 DigitalOcean Kubernetes。
借助 DigitalOcean 实现高带宽稳定性与可靠性
Bright Data 采用多云架构,能够结合不同云服务提供商的优势,为业务提供更高的灵活性。DigitalOcean 对开源与透明性的坚持,使企业可以根据自身需求自由配置基础设施,同时也让 DigitalOcean 成为一个可靠的长期合作伙伴。对于 Bright Data 来说,这意味着他们可以借助 DigitalOcean 可扩展、稳定的 Droplets 实例以及低成本带宽,来维护代理服务器,并通过简洁的 API 快速扩展规模。
Bright Data 使用 DigitalOcean Droplets 云服务器部署其 Web 数据采集平台,对公开互联网进行爬取,收集并整理信息。相比其他云服务商,Droplets 在稳定性与带宽能力上具备更优性价比,使 Bright Data 能够提升数据处理规模,并随着客户增长持续扩展。同时,借助 DigitalOcean API,Droplets 的快速部署也让扩展变得更加轻松。
“我们很快发现,DigitalOcean 在 Droplets 稳定性、带宽以及数据中心网络方面的表现是最好的,非常稳定。这一点至关重要,也正是这种稳定性帮助我们不断提升业务规模。”——Nir Borenshtein,Bright Data COO
到 2016 年,Bright Data 已拥有 1000 万住宅 IP,到 2018 年增长至 3500 万。到 2019 年,公司团队从 2014 年的 8 人扩展至 120 人,并推出多款新产品。近几年,Bright Data 实现了指数级增长,目前服务超过 15,000 家客户,团队规模超过 450 人,分布在 17 个国家,并在美国设立了主要办公地点。2021 年,公司年收入突破 1 亿美元,并完成了 3 起收购,而 DigitalOcean 一直伴随其发展。
Bright Data 每天通过 DigitalOcean 服务器处理数百 TB 的数据。到 2022 年初,公司在 DigitalOcean 上运行近 6000 个 Droplets,由一个小型团队维护整个云网络。DigitalOcean 的高可靠性帮助 Bright Data 实现每年超过 12,000 次产品发布,平均每天发布 60–80 个新版本,不断优化其 Web 数据平台。
此外,公司还建立了完善的合规部门,并制定了行业领先的流程与规范,以确保数据质量和可靠性达到最高标准。
“DigitalOcean 提供的技术非常强大,让我们能够高效运作。其 API 和快速部署能力,以及良好的扩展性,对我们来说极具价值,我们一直在持续使用这些能力。”——Nir Borenshtein,Bright Data COO
迁移至 DigitalOcean Kubernetes
作为一支注重效率与创新的团队,Bright Data 始终在寻找最优解决方案。其业务负载具有明显的周期性:工作时间内使用率较高,而在非工作时间及周末则较低。由于负载波动较大,Droplets 的平均利用率仅约为 60%,存在资源浪费问题。因此,他们需要一种能够根据需求自动扩展的方案,以避免为高峰流量预留大量闲置资源。为此,团队决定迁移至 DigitalOcean Kubernetes。
“我们的负载是动态变化的,周末较低,工作日较高。虽然我们可以通过 DigitalOcean API 创建 Droplets 并部署系统,但从整体来看,这不如 Kubernetes 强大。我们希望尽快解决资源利用率不足的问题,而唯一可行的方案就是 DigitalOcean Kubernetes。”——Nir Borenshtein,Bright Data COO
Bright Data 将其核心产品之一——数据平台进行了容器化改造,并迁移至 Kubernetes(这一过程通常被称为 lift-and-shift)。团队在大约三周内完成了最小可行产品(MVP),并很快投入生产使用。随后,他们将服务器迁移至 Kubernetes,并通过 Terraform 实现自动化资源配置,同时改造了容器构建流程,并开发了自有的 CI/CD 工具。
“Kubernetes 运行更快、效果更好,而且我们无需重新设计系统。它让我们能够专注于开发,同时实现高效扩展。借助 DigitalOcean Kubernetes,我们可以更快增长,并通过充分利用 Droplets 来降低成本。”——Nir Borenshtein,Bright Data COO
持续增长以满足客户需求
快速增长也带来了新的挑战。COO Nir Borenshtein 表示,在公司发展过程中,他们逐渐认识到最重要的两大资产是“人才”和“技术”。从最初的 8 人团队发展到如今的 450 人,需要管理层不断优化制度与流程,同时持续吸引并留住顶尖人才。他认为,要在行业中保持领先地位,必须持续投入创意与创新。目前,公司已提交超过 2200 项专利申请,并仍在快速发展中。
“我们的增长不是偶然的,而是因为市场对 Web 数据的需求真实存在。随着业务扩张,我们面临的客户交付压力也在增加。需求越大,对速度和创新的要求也越高。我们的目标是为所有客户按时提供高质量、可靠的数据,并持续打造能够解决数据挑战的技术。”——Nir Borenshtein,Bright Data COO
Bright Data 目前仍是行业的领先者,并将继续保持这一地位。其对卓越的追求贯穿业务的各个方面,而与 DigitalOcean 的合作,也让他们能够将精力集中在最关键的领域。



