地址:朝阳区朝外大街朝外soho乙6号2层0253
邮箱:info@towntour.net
电话:010-58692298
传真:010-58692298
时间抵达2026年5月,AI产业正处于训练与推理之间深刻转型的关口。大语言模型的规模每十个月翻一番,算力成本的问题从未像今天这样紧迫地摆在每一位科技企业负责人面前:仅仅依靠采购更多数量的GPU,真的足够吗?
答案是否定的——因为一个更关键的问题被忽略了:芯片之间的通信,正在成为计算效率的瓶颈。
在硅谷森尼韦尔市的一间会议室里,Cerebras Systems公司的技术团队正在向到访的国际商务考察成员展示一组震撼的数据:搭载第三代晶圆级引擎WSE-3的CS-3系统,以每用户每秒2500个token的速度运行Llama 4 Maverick推理,比英伟达旗舰DGX B200 Blackwell系统运行相同4000亿参数模型快两倍以上。
这组数据所传递的信号,正是当前人工智能基础计算设施面临的一次范式转变。
对于正在聚焦算力投资的中国企业决策者而言,本次由中瑭国际组织的海外商务考察硅谷行,将专门深入Cerebras总部,系统解读晶圆级芯片的技术逻辑与商业前景。这是一次从GPU集群"加法思维"到晶圆级"芯片即系统"的认知跃迁。

01 ⬩ 别了GPU,你好晶圆
当"切碎"的传统被彻底颠覆
理解Cerebras出国考察价值的关键,在于先理解传统GPU的根本性瓶颈。
在大语言模型高并发推理的场景中,主要的制约因素并不是浮点运算能力,而是内存带宽的限制。当一个大型语言模型响应一次提问时:
每一层transformer都需要把权重从内存读出来。
然后做矩阵乘法,再写回去。
如果芯片之间必须频繁交换数据,读写的"搬运"时间远大于"计算"时间。
这也就是为什么,在GPU体系下,即便是数万张卡叠加成一个集群,依然要面对数据传输效率从100%衰减为1%甚至几千分之一的实际问题。
Cerebras在2016年创立之初就决定了反其道而行之的路径。这家公司的创始团队在2015年由Andrew Feldman、Gary Lauterbach、Michael James、Sean Lie和Jean-Philippe Fricker联合成立。CEO Feldman是一位连续创业者,他此前的公司SeaMicro在2012年以3.34亿美元卖给AMD,随后他在AMD担任副总裁,积累了深厚的硬件经验[reference:2]。正是看到AI算力需求即将爆发,他与团队决定将整片晶圆用为处理器,而不是先切割成数百个小芯片再费力组装。
2019年,Cerebras推出第一代WSE-1和CS-1系统,首次将"晶圆级引擎"概念落地。2021年,WSE-2进一步提升了晶体管与核心数。到了2024年3月,第三代WSE-3问世——这是真正的性能领导者:4万亿个晶体管,比市场上主流的GPU多出数十倍,90万个AI优化核心,44GB片上SRAM。WSE-3内部结构如同一张巨大的城市交通网,所有道路都在同一块硅基板内部完成通信,无需离开芯片去访问外部缓慢的HBM或GDDR内存。
Cerebras公司目前在全球各地区部署的CS系列AI超级计算机系统[reference:5],其影响力正在整个AI基础设施生态中加速渗透。
02 ⬩ CS-3系统:一个迷你冰箱里藏着什么
技术的全貌,决定商业的价值
从外观看,Cerebras CS-3大约相当于一个紧凑的迷你冰箱大小。它不是日常印象中的服务器机箱,而是深度集成了一颗WSE-3的巨大水冷整机。CS-3系统通过SwarmX互连技术,可以将最多2048个CS-3系统连接成一个超级计算集群,提供256 exaflops的AI算力,能够训练参数规模达24万亿的模型。
这项性能对比意味着什么?
一个2026年5月的最新S-1招股备案文件显示,WSE-3对比英伟达B200的关键性能指标如下:
晶体管数量:WSE-3的4万亿颗,是B200的19倍。
片上内存容量:44GB对比B200的192GB HBM3? 但WSE-3的优势在于其为SRAM片上访问,并非通过芯片外部缓慢轮转内存。WSE-3片上内存容量是英伟达H100的880倍。
内存带宽:21PB/s(约21000 TB/s),是H100存储器内存带宽的7000倍。
AI推理速度:在运行Llama 4 Maverick模型时,达到每秒2500 tokens/用户,速度比DGX B200 Blackwell系统快一倍以上。
训练效率:四颗WSE-3并发可在一天内完成700亿参数模型的训练。
生成代码量:CS-3系统所需训练代码量较GPU减少不少,GPT-3级别模型用Cerebras仅需565行代码。
一个可参考的案例是:训练Llama 2-70B在Meta的GPU集群上大约用了一个月,而2048个CS-3集群能在不到一天内从头完成相同训练任务。这种可微分差距,使得海外商务考察的团队能够感知技术迭代的实际效率翻倍。
03 ⬩ 大客户阵容|从中东到OpenAI的超级订单
营收5.1亿美元背后,谁在选择晶圆级芯片?
在过往的美国商务考察安排中,团队通常需要从财务报表之外解读技术创新的真实市场认可度。Cerebras在2025年交出了一份让硅谷侧目的数据:
年营收达到了约5.1亿美元,同比增长76%,净利润从2024年的亏损约4.82亿美元转正为盈利约2.38亿美元。营收从2022年的2460万美元增长到2025年的5.1亿美元,四年增长超19倍。
客户名单覆盖全球颇具影响力的研究机构与头部企业:
OpenAI:2026年1月与Cerebras签订价值超过200亿美元多年期协议,采纳750兆瓦算力支持;同时OpenAI向Cerebras提供了10亿美元贷款并获得了约3300万股近乎免费的认股权证。
AWS(亚马逊云科技):与Cerebras签署多年合作,将在数据中心部署CS-3整机设备,并通过AWS Bedrock向客户开放WSE-3芯片的使用。AWS计划将其自研Trainium处理器与Cerebras芯片搭配为混合推理架构。
阿联酋G42和MBZUAI:Cerebras与G42的深度合作共同构建了Condor Galaxy超级计算网络,其中CG-1具有4 exaFLOPs FP16性能和5400万核心。G42还投入超过67亿美元与Cerebras分阶段共建九个AI超级计算机。MBZUAI在2025年贡献了Cerebras总营收的62%,G42贡献24%,两家合计达到86%。
Meta也在其Llama API中引入CS-3系统;知名基准测试独立机构Artificial Analysis测试后表示,在数十家AI推供商中,Cerebras是唯一在Meta旗舰模型上超越Blackwell的系统[reference:23]。
2026年3月,AWS的合作正式进入执行阶段,将在2026年下半年推出基于Cerebras芯片的新服务。同年2月,Cerebras完成10亿美元H轮融资。
Cerebras于2026年5月13日确定IPO定价区间上调至每股150至160美元,发行3000万股,拟募资约48亿美元,估值约488亿美元。
这些大额合约和资本交易表明,当头部公司愿意为一款新型专用硬件支付超过200亿美元协议时,这意味着基础设施正在发生某种根本性转变。
04 ⬩ 建筑•里里外外:走进森尼韦尔的硬件实验室
不是用眼睛看,是用原理去验证
当考察团队抵达位于加州森尼韦尔的Cerebras总部,迎面而来的绝不是商业炫耀,而是硬件工程师团队直接讲解整个晶圆级引擎如何"炼成"的技术流派过程。
Cerebras并没有在大众媒体中大力渲染自身产品,其关键IP隐匿于向高端企业设计服务流程中。考察团将通过中瑭国际的定制通道,邀请公司的系统架构师与产品营销总监进行内部课:
晶圆级良率之道:通常晶圆上有一定数量的缺陷单元,传统工艺会导致有效芯片数下降。Cerebras是如何通过单个AI核心微缩到0.05mm²(H100 SM一个核心的1%)——让芯片阵列有冗余核心,用片上网络替换故障区域,实现在大硅片上无中断高效运行。
PowerVia与背面供电:虽然这项深层技术是英特尔率先发布的,但Cerebras为WSE在硅背布线密度上做了巧妙修复,解除芯片两侧干扰,大幅降低发热和信号耦合。
MemoryX权重流:CS-3支持外挂最多约1.2PB(即1200TB)外部内存,将大量参数存储在外部存储器中按需流入WSE-3中计算,从而在单一逻辑装置上接纳24万亿参数的模型。
参访区域时,还有机会看到WSE-3被封装到底层机电基板上的确切工艺控制——这通常要求在大型洁净室内进行超精度贴装,整个过程对外界保密,但对于中瑭国际的考察团员,会有专门的技术披露环节。
05 ⬩ 从英伟达"阴影"到OpenAI实验室
横向比较思考:晶圆级与GPU的未来共存
考察行程的互动研讨环节,Cerebras公司的产品规划和商业化负责人将涉足一个半年来争议不断的问题:有了WSE-3,AI产业还需要传统GPU集群吗?
通过实际数据交叉对比,结果并非零和博弈。
硬件层面,WSE-3在推理的低延迟矩阵运算上相比传统GPU方案有着更显著的加速能力,在8-GPU系统配置的训练场景下,单个WSE-3可以快10倍以上,由于没有互连延迟且拥有一条巨量并行内存流水线[reference:29]。但是,对于非LLM类型的老式并行计算负载,传统GPU生态的CUDA软件覆盖度依然不可替代。
财务维度,Cerebras的硬件毛利率约39%,而GPU方案则超过75%。也就是说像AMD、英伟达等公司甚至可以从每个GPU中获得更高比例的利润,这背后反映了软件成熟度和客户锁定效应。Cerebras的机会在于"极致性能专用化"——在某些客户愿意为推理速度付出溢价的高频交互业务中(如实时AI Agent、语音对话助手、股票高频推荐引擎等),客户愿意直接支付Cerebras设备的额外佣金来避免GPU方案时的滞后响应。
考察交流环节还涉及一个既定事实——AWS开放Cerebras算力服务,意味着任何AWS开发者可利用Bedrock平台的混合推理加速路径。这一层合作极大拓展了Cerebras在没有区域IT运维能力的企业市场面前的可用性,这个新的分发入口或许比Cerebras自己的云服务更具备渗透力。
2026年5月14日,Cerebras在纳斯达克敲钟,股票代码CBRS。市场将实时观察"晶圆级挑战者"在二级市场能否站稳。
06 ⬩ cAIr系统与中型模型训练的新视界
让500人AI团队的一日微调变成现实
2025年4月,在爱丁堡大学——由EPCC超算中心运营的欧洲最大CS-3系统集群,展示了更贴近实际企业使用场景的用例。这套CS-3集群的部署具备出色的灵活性,CLI程序员和科研人员能在一天内完成一个700亿参数型模型的微调操作,即使这些人并非AI大规模并行专家。
对于国内企业来说,这意味着两件关键事项的解放:
不再需要数周进行跨多个GPU节点的模型分片部署与通信调试——因为CS-3单一系统自动在统一内存空间中容纳庞大的参数量,程序员不必用复杂的Megatron/DeepSpeed多机划分逻辑。
减少因内存不足(OOM)造成的训练失败。GPU集群在大参数模型上不止一次出现因为内存满额而重启耗时多天,而CS-3设计目标就是确保不超过44GB片上随机缓存大核心部分并把参数流放到MemoryX中。
那些在时间窗口性、资源紧缺性的中小企业或内部AI实验室,可以借助此条件重新定义从实验室到生产场域的模型迭代速度。
07 ⬩ 连接世界芯版图:中瑭国际的商业协作力
让一次考察不是单向猎奇,而是双向资源匹配
作为一家在全球多地提供服务的大型商务咨询公司,中瑭国际在美国加州拥有实体分公司及熟悉当地科技行业的对接中心。针对海外商务考察硅谷Cerebras板块,设计师可以从以下几个角度供给差异化:
专属时长与层级:按客户决策级别,可分半天中层普及版(侧重技术评估)及1天深入版(含核心架构师闭门技术研讨),并配合CEO特殊圆桌午宴(若Feldman时间允许)。
供应链生态对接:针对中国本土先进封装与算力服务商,将Cerebras的晶圆设计理念与Foundry工业相对接,了解台积电5nm定制流程和日月光特殊测试封装资源。
联合研讨话题:涉及中国企业在"主权AI"算力投资中,如何将国产大模型适配到异构芯片路线,邀请Cerebras国际商务合作经理直接回答问题。
全程服务闭环:中瑭国际北京总部团队从签证预约、机票酒店及当地商务领队,到专业的口译笔记人员和考察前课前文档分发全部维持专业流程。活动结束,发给每个人都获得由Cerebras企业与中瑭国际联合认证的项目行程授证与数字资产记录。
这一次的出海考察之旅,绝非走马观花。它是一次在计算代际变革窗口期,把来自硅谷一流芯片创新公司的前沿思维,带回并深度国产化的认知提升行动。
当考察大巴驶离森尼韦尔的那一刻,车窗外的一片普通办公楼并不显眼,但你知道,就在那扇普通的门背后,人类正在用一种前所未有的大尺度硬件方式,重塑AI计算的基础设施。
也许,五年后回头看WSE-3,就像回顾从晶体管到CPU的跨越一样。
那时的中国企业家会想:"我是那首批认知到这种转变的人吗?"
——答案,取决于这一次在Cerebras的硅谷之行。
中瑭国际为你打通了这条信息鸿沟。
权威信源列表
① 2024-03-14 百度百科《WSE-3》
② 2025-04-08 爱丁堡大学DDI《Cerebras installs largest CS-3 cluster in Europe at University of Edinburgh》
③ 2026-02-05 百度百科《Cerebras》
④ 2026-04-18 金融界《业绩扭亏+接连拿下亚马逊、OpenAI大单 Cerebras(CBRS.US)再度冲刺美股IPO》
⑤ 2026-05-13 智通财经《Cerebras(CBRS.US)上調IPO發行規模與指導價,擬募資48億美元成為今年美股最大上市項目》
⑥ 2026-05-12 PANews《Cerebras IPO:488亿美元估值,「英伟达挑战者」是泡沫还是新王?》
⑦ 2026-03-16 EEPW《AWS将把Cerebras晶圆级WSE-3芯片引入云平台》
国际专家智库
INTERNATIONAL THINKING TANK
作为直接服务于中国企业转型升级、创新变革的平台,中瑭国际建立资深专家智库,以工业4.0,智能制做等课程的讲授、主题会谈、交流分享等方式让中国企业目瞻前沿、论道全球。
全球合作资源
GLOBAL COOPERATION RESOURCES
十余年的项目经验和口碑,奠定了与全球六十多个国家的广泛联络和友好的合作,得到全球各顶尖大学、知名企业、各国政府商务部门、各行业协会与商会等多家海外组织与机构支持,为中国国内各界提供真正专业的一站式海外商务考察和培训服务。
SUCCESSFUL CASE
成功案例
中瑭国际与德国、美国、日本、以色列等发达国家的众多政府机构、企业、高校、研究所等建立了长期稳定的合作伙伴关系。为您提供最实效的培训及考察方案,助力中国企业走出去,学习全球领先的管理和技术。
HOT RECOMMENDATION
精选全球资源
中瑭国际以全球创新大变革时代为背景,精选全球优质项目,秉持“全球智慧助推中国企业创新与变革”的理念,致力于满足企业商务考察需求,共享全球“制”慧。