谷歌发布两款面向智能体时代的新款TPU

1个月前7 分钟阅读

谷歌Cloud Next 2026大会公布了一项重大的硬件转向，标志着AI基础设施战场的战略重新校准。他们发布了两款新的张量处理单元——一款用于训练，一款用于推理——这些芯片明确为所谓的“智能体时代”而设计，在该时代中，模型不仅生成文本，还能实时推理、规划并操控外部工具。这是对英伟达在加速器市场主导地位的直接挑战，而且不仅关乎性能，还关乎经济效益。在英伟达集群上运行智能体工作负载的成本已变得极其高昂，而谷歌押注于专用芯片——推理芯片由Marvell合作制造——能为云客户带来更优的总拥有成本。作为arXiv论文的常读者，我感兴趣的是这种架构拆分：将训练和推理芯片分离开来，是承认构建模型与在响应式、工具调用环境中部署模型之间存在迥异计算需求的选择。智能体系统更多地受限于延迟和内存带宽，而非原始浮点运算能力，因此一款针对推理优化的TPU，能够处理动态图与长上下文推理，可能成为真正的差异化优势。谷歌将为其自己的Gemini模型提供动力，也向第三方提供该芯片，这意味着他们正在复制AWS Nitro的策略——不仅销售计算能力，还构建一个垂直堆栈，从而增加迁移黏性。英伟达在软件生态系统和广泛模型支持方面仍占据巨大领先优势，但谷歌的举措是一项长期对冲，可能使市场碎片化，并迫使英伟达在蛮力之外展开竞争。智能体化转型是真实存在的——LangChain的普及、OpenAI的函数调用、Anthropic的工具使用——而胜出的硬件将是能最小化这些循环摩擦的那一方。这是AI芯片战争第二战线的开幕信号，战斗焦点是延迟与成本，而非仅仅是每秒万亿次浮点运算。.

#TPU

#Google

#AI chips

#hardware

#Nvidia

#inference

#training

#custom silicon

#cloud computing

#AI agents

#editorial picks

保持知情，明智行动。