生成式AI的竞争已经烧到了芯片层。OpenAI近日正式揭晓其首款定制AI加速器“Jalapeño”,标志着这家以GPT系列模型闻名的公司,正式下场做芯片。这款与博通(Broadcom)和天弘(Celestica)联合开发的芯片专为AI推理设计,目标场景明确——从2026年起,部署在吉瓦级超大规模数据中心里,跑自家和行业的头部大模型。
OpenAI目前最赚钱的产品ChatGPT和Codex,本质上是“模型推理”业务——用户每次提问、每行代码生成,背后都是GPU或ASIC在烧算力。买别人的芯片,成本结构算得过来,但规模大到一定程度,自研的性价比就浮现了。Jalapeño的使命就是把推理环节的单位算力成本打下来。
OpenAI总裁兼联合创始人格雷格·布罗克曼把这颗芯片定位为“长期全栈基础设施战略”的一部分,目标是让计算资源更充裕,AI更快、更可靠、更便宜,能解决更重要的难题。负责硬件项目的理查德·何进一步解释,Jalapeño围绕前沿AI系统最重要的推理负载做了优化,早期测试显示它能把关键负载高效跑到接近硬件理论极限。
从已公布的技术特征看,Jalapeño并非通用型AI加速器,而是专门按大语言模型推理的计算、内存、网络和模型服务需求来设计的架构。OpenAI宣称该芯片在减少数据搬移的同时,平衡了计算、内存和网络资源,提升了硬件利用率。博通贡献了芯片实现和网络技术,包括其Tomahawk网络平台。
一个不得不提的效率指标是开发速度。从初始设计到制造流片,Jalapeño只用了9个月。OpenAI称之为高性能先进半导体领域可能最快的ASIC开发周期。这背后一方面是OpenAI与博通工程师之间深入的软硬件协同设计,另一方面是OpenAI让自己的AI模型参与了芯片设计和优化流程的加速。
博通总裁兼CEO陈福阳把这次合作定位为“对AI未来十年所需的物理基础设施规模化做出的根本性承诺”。天弘则提供系统集成经验,三方组合形成了设计—制造—集成的闭环。
Jalapeño的工程样品已在实验室里运行机器学习负载,包括GPT-5.3-Codex-Spark,且跑在目标频率和功耗水平。详细性能基准将在稍后公布。OpenAI同时强调,这颗芯片不仅服务于自家模型,也意在整个AI产业的前沿模型推理。
从产业逻辑看,自研芯片是大模型公司在“API经济学”上走到一定阶段的必然选择。当模型推理的边际成本构成主要运营支出,用通用硬件跑专有负载的浪费会越来越难以容忍。Jalapeño是OpenAI多代计算平台的首款产品,后续可能会形成一个覆盖推理、训练乃至更细分场景的芯片矩阵。这笔从软件层向下扎到硅层的投资,若能兑现其能效承诺,将直接改变OpenAI与云厂商和芯片供应商之间的议价格局。
35 0
登陆后参与评论
2026-06-25 08:42:20
2026-06-24 08:31:18
2026-06-24 08:26:54
2026-06-24 08:25:04
2026-06-23 09:12:53
2026-06-23 08:54:29
2026-06-23 08:51:30
2026-06-23 08:38:06
2026-06-23 08:34:34
2026-06-22 09:23:45
2026-06-22 09:16:29
2026-06-21 08:28:12