云豹完成B轮融资晋升独角兽,众为资本为A轮联合领投方
2022年6月23日

近日,知名财经媒体《晚点 LatePost》独家报道, DPU 创业公司云豹智能获得数亿元人民币的新一轮融资

2021年9月,云豹智能完成A轮融资,众为资本为联合领投方。时隔不到一年,云豹智能完成B轮融资,据悉本轮云豹投后估值约 90 亿元,成为DPU赛道新晋独角兽企业。众为资本坚定看好云豹智能团队在DPU领域的技术实力与产业经验,将继续与公司携手同行,引领助力数据中心基础架构的变革创新,助力中国数字经济发展。

众为资本合伙人于晓璐表示,“随着数据处理需求的爆炸增长,DPU芯片作为数据中心领域三大芯片之一,是半导体行业全球创新研发的新高地,亟待中国企业的技术攻关。其中,云豹智能创始人萧启阳博士,拥有丰富的科研学术背景以及硅谷大芯片的成功创业经历。公司聚焦于DPU研发创新,具备“软件定义芯片”的高壁垒技术,未来成长空间值得期待。”

本期晚点 LatePost采访完整文章分享如下:

一种出现不到十年的芯片新类型,DPU (Data Processing Unit,数据处理器),如今吸引了众多互联网大公司的投入。它们要么自己造,如亚马逊和阿里;要么投资创业公司,如腾讯、美团、字节跳动和百度。

《晚点 LatePost》独家获悉,腾讯近期投资了 DPU 创业公司云豹智能数亿元人民币的新一轮融资,其他投资方包括淡马锡、深创投、华西村股份旗下投资平台一村资本、民生银行上市金融控股平台民银资本、耀途资本,云豹投后估值约 90 亿元。

这是腾讯第 3 次投资这家成立不到 2 年的 DPU 公司。据工商信息,腾讯目前在云豹持股 26.31%,是其第一大外部股东。腾讯在被投企业的持股多数不超过 20%。

云豹由博通前处理器和无线基础设施事业部大中华区总经理萧启阳在 2020 年底创办。萧启阳并不是典型的芯片外企高管,而是一位有经验的创业者。2002 年,他在硅谷创立了 RMI 公司,其芯片产品被应用于路由器、基站等网络通讯设备;2009 年,RMI 被美国上市公司 NetLogic 收购,2 年后,NetLogic 又被博通以 37 亿美元收购,萧启阳随后加入博通,直至 2020 年着手创立云豹。

云豹核心成员来自博通、英特尔、海思和 Arm 等公司,目前团队近 400 人。据《晚点 LatePost》了解,云豹的第一款 DPU SoC(系统级芯片)正在开发阶段,计划于明年量产。去年底云豹已发布基于 FPGA 版本的 DPU 云霄。

DPU 现在备受关注,是因为它和 CPU、GPU/AI 芯片一起构成了数据中心的新一代支柱芯片,被认为是比肩 CPU、GPU 的大机会。其主要客户是大型云计算公司和互联网公司。据研究机构 Canalys 预测,到 2023 年,中国 DPU 市场规模将接近 200 亿元。

DPU 之外,腾讯在去年底参与了 GPU 创业公司摩尔线程的 20 亿元 A 轮融资。此前腾讯还连续参与了 AI 芯片公司燧原科技的 4 轮融资,目前在燧原持股 20.5%。燧原的产品也是服务云端数据中心的大芯片。

DPU 的诞生,源于数据中心 CPU 逐步 “卸担子” 的过程。

在传统数据中心里,CPU 身兼数职:不仅处理各种业务任务、做通用计算,还要负责整个服务器集群的运维,实现网络、存储、安全和虚拟化等功能。这就像一个商店店员,既负责售卖商品等直接业务工作,也要搬东西、排货、管理物流……这消耗了不少 CPU 资源,使 CPU 不能专注处理业务任务。

2012 年之后,原本被用作图形渲染的 GPU 和专门为 AI 加速开发的 AI 芯片逐渐分走了 CPU 的部分通用计算工作。它们长于处理高速增长的 AI 计算需求。

接着是在 2014 年,亚马逊开始和以色列创业公司 Annapurna Labs 一起开发 DPU 的雏形。它可以被理解为实现服务器网络互联的智能网卡的 “加强版”。DPU 负责将不同数据处理工作,合理分配给 CPU 或 GPU;它还进一步从 CPU 手中接管了网络、安全、虚拟化、存储等数据中心运维任务,以让 CPU 专注处理业务任务,减少算力资源浪费,提升整体效率。

在与 Annapurna Labs 合作一年后,亚马逊在 2015 年以 3.5 亿美元收购了该公司,并在 2017 年推出了 Nitro,它被认为是 DPU 出现的标志。2020 年的英伟达技术大会上,英伟达创始人黄仁勋提出 CPU+GPU+DPU 将是数据中心的系统解决方案;同年,英伟达以 69 亿美元收购了全球智能网卡龙头公司 Mellanox,旨在开发自己的 DPU 产品,这个交易推动了 DPU 热潮。

英特尔于去年 6 月推出 IPU(Infrastructure Processing Unit,功能和理念类似 DPU);不到 1 个月后,Marvell 发布了自己的 DPU;今年 4 月,AMD 以 19 亿美元收购了 2017 年成立的美国 DPU 创业公司 Pensando。

在中国,阿里、华为选择像亚马逊那样自研 DPU。阿里在 2017 年发布了虚拟化技术神龙架构,目的是减少虚拟化对 CPU 资源的损耗,其硬件部分能实现类似 DPU 的功能。华为海思 2020 年发布的 Hi1822 网卡也具有部分 DPU 功能,目前已应用在华为自研的 TaiShan 服务器上。

腾讯、美团、字节等数据中心芯片大客户则选择投资创业企业。

自 2020 年以来,中国诞生了云豹、云脉芯联、星云智联、大禹智芯、中科驭数等一批 DPU 公司,也有芯启源等成立更早的公司在近两年转向了 DPU 方向。

腾讯连续投资了云豹,字节在去年投资了云脉芯联(2021 年 5 月成立),美团和百度分别在去年和今年投资了星云智联(2021 年 3 月成立)。云脉芯联由曾任职于思科、阿里和华为的刘永锋创立,星云智联由曾在华为任职多年的夏庐生创立。

同样是数据中心的大芯片,相比非常通用的 CPU、GPU,DPU 需要和客户业务场景更紧密地结合。

一位 DPU 公司投资人解释,不同的客户,由于业务场景不同,其对应的数据类型、数据结构也不相同,在数据处理层面,这表现为数据包大小、任务优先级和性能侧重的差异——比如直播、游戏相关的数据处理侧重低延时,金融业务的数据处理侧重安全性。不同客户数据中心的基础设施架构,即服务器、芯片和系统的搭配也有一定差异,这也需要 DPU 做一些针对性适配。

“如果不与大客户深入合作,DPU 很难实现提升效率的初衷。” 这位投资人说。

一位 DPU 从业者认为,DPU 可以做到不错的通用性,前提是深入了解各种业务场景,知道怎么把场景拆解成相应的数据处理流程,并筛选出最主流、最有商业价值的场景。“DPU 公司不可能无穷无尽去支持所有业务场景,而是要以最便宜的成本去打 90% 的共性需求。” 他说。与芯片用量大、场景丰富的大客户合作,能帮助 DPU 公司积累对业务的理解。

这也是为什么 DPU 创业公司愿意在非常早期就接受某一家互联网大公司的投资,并让其占不小的份额,它们更希望提前与潜在客户建立关系,而不追求第三方中立供应商的地位。

腾讯是云豹最早的投资人之一,也有可能是云豹的第一批客户。据《晚点 LatePost》了解,腾讯已在测试云豹的一些芯片功能。

DPU 的另一特点是,它是一种新的芯片类型。这是机会所在:这个市场尚没有垄断巨头。全球范围内,现在只有亚马逊自研的 Nitro 已被大规模使用。据亚马逊 AWS 资深副总裁 James Hamilton 2019 年发布的博客,当时亚马逊一年的 Nitro 芯片用量已达数百万片, Nitro 并不对外出售。英伟达、英特尔、AMD 等公司的 DPU 产品都还在开发或迭代中。

这也带来了有别于 CPU、GPU 创业的另一种风险:整个 DPU 行业都处于早期阶段,产品形态不确定,公司可能选错路线。

在芯片形态上,目前 DPU 有基于 SoC(系统级芯片,DPU 的 SoC 一般包含 CPU 和 ASIC,即专用集成芯片)和基于 FPGA 的两种形态。前者功耗低、性能高、成本低;后者更灵活,更易应对业务变化,但成本更高。亚马逊的 Nitro 使用了 ASIC 架构,阿里的神龙目前是 FPGA 形态。

一位 DPU 从业者认为,包含 ASIC 的 SoC 会是未来 DPU 的主流,相比 FPGA 方案,它的成本降低了 50%,性能提高了数倍。也有行业观点认为,由于客户需求不同,两种形态会长期共存。

在功能上,一位芯片领域投资人告诉《晚点 LatePost》,DPU 可分为 “CPU 派” 和 “网络派”。前者的 DPU 中会包含一个处理能力很强的 CPU,一般是 Arm IP CPU,它可以处理和数据调度、存储等相关的大部分数据中心运维任务,英伟达、阿里和云豹都是这一路线。另一路线更强调网络能力,亚马逊的 Nitro、英特尔的 IPU、AMD 收购的 Pensando 和中国创业公司云脉芯联更偏重这一路线。

也是由于 DPU 尚在发展之中,形态还没有完全确定,它与自己的 “前身” 智能网卡之间界限模糊。有投资人告诉《晚点 LatePost》,很多公司是打着 DPU 旗号做着智能网卡,快速获得了大量投资和高估值,但并没有开发引领性产品。

最直观、有效的辨别方法是看客户反馈:不管是什么架构、实现方式如何,有竞争力的 DPU 产品应能显著提升数据中心效率。

现在还不到能获得客户反馈的时间点。与 CPU、GPU 等数据中心大芯片一样,DPU 结构复杂、开发周期长、投入大。一位 DPU 公司高管称,从 0 开发出一款量产的 DPU SoC, 至少要花 3 亿美元,开发约 2 年。中国的 DPU 创业公司多起步于 2020 年和 2021 年,算上前期团队组建时间,开发周期多在 1 年左右,量产产品还未上市。

中国公司做 GPU、CPU,难在与巨头抢食,冲破生态壁垒;做 DPU 的挑战则是整个赛道很新,面临更大不确定性,没有可以照着学的标准答案。