OpenAI首款定制芯片Jalapeño亮相，专攻大模型推理，2026年部署吉瓦级数据中心

打印派 2026-06-25 08:30:40

生成式AI的竞争已经烧到了芯片层。OpenAI近日正式揭晓其首款定制AI加速器“Jalapeño”，标志着这家以GPT系列模型闻名的公司，正式下场做芯片。这款与博通（Broadcom）和天弘（Celestica）联合开发的芯片专为AI推理设计，目标场景明确——从2026年起，部署在吉瓦级超大规模数据中心里，跑自家和行业的头部大模型。

OpenAI目前最赚钱的产品ChatGPT和Codex，本质上是“模型推理”业务——用户每次提问、每行代码生成，背后都是GPU或ASIC在烧算力。买别人的芯片，成本结构算得过来，但规模大到一定程度，自研的性价比就浮现了。Jalapeño的使命就是把推理环节的单位算力成本打下来。

OpenAI总裁兼联合创始人格雷格·布罗克曼把这颗芯片定位为“长期全栈基础设施战略”的一部分，目标是让计算资源更充裕，AI更快、更可靠、更便宜，能解决更重要的难题。负责硬件项目的理查德·何进一步解释，Jalapeño围绕前沿AI系统最重要的推理负载做了优化，早期测试显示它能把关键负载高效跑到接近硬件理论极限。

从已公布的技术特征看，Jalapeño并非通用型AI加速器，而是专门按大语言模型推理的计算、内存、网络和模型服务需求来设计的架构。OpenAI宣称该芯片在减少数据搬移的同时，平衡了计算、内存和网络资源，提升了硬件利用率。博通贡献了芯片实现和网络技术，包括其Tomahawk网络平台。

一个不得不提的效率指标是开发速度。从初始设计到制造流片，Jalapeño只用了9个月。OpenAI称之为高性能先进半导体领域可能最快的ASIC开发周期。这背后一方面是OpenAI与博通工程师之间深入的软硬件协同设计，另一方面是OpenAI让自己的AI模型参与了芯片设计和优化流程的加速。

博通总裁兼CEO陈福阳把这次合作定位为“对AI未来十年所需的物理基础设施规模化做出的根本性承诺”。天弘则提供系统集成经验，三方组合形成了设计—制造—集成的闭环。

Jalapeño的工程样品已在实验室里运行机器学习负载，包括GPT-5.3-Codex-Spark，且跑在目标频率和功耗水平。详细性能基准将在稍后公布。OpenAI同时强调，这颗芯片不仅服务于自家模型，也意在整个AI产业的前沿模型推理。

从产业逻辑看，自研芯片是大模型公司在“API经济学”上走到一定阶段的必然选择。当模型推理的边际成本构成主要运营支出，用通用硬件跑专有负载的浪费会越来越难以容忍。Jalapeño是OpenAI多代计算平台的首款产品，后续可能会形成一个覆盖推理、训练乃至更细分场景的芯片矩阵。这笔从软件层向下扎到硅层的投资，若能兑现其能效承诺，将直接改变OpenAI与云厂商和芯片供应商之间的议价格局。

35 0

发表评论

登陆后参与评论