1. 新闻
  2. ai
  3. 谷歌发布两款面向智能体时代的新款TPU
post-main
AIchips & hardwareGoogle TPU

谷歌发布两款面向智能体时代的新款TPU

MA
Ma Lin
19小时前7 分钟阅读
谷歌Cloud Next 2026大会公布了一项重大的硬件转向,标志着AI基础设施战场的战略重新校准。他们发布了两款新的张量处理单元——一款用于训练,一款用于推理——这些芯片明确为所谓的“智能体时代”而设计,在该时代中,模型不仅生成文本,还能实时推理、规划并操控外部工具。这是对英伟达在加速器市场主导地位的直接挑战,而且不仅关乎性能,还关乎经济效益。在英伟达集群上运行智能体工作负载的成本已变得极其高昂,而谷歌押注于专用芯片——推理芯片由Marvell合作制造——能为云客户带来更优的总拥有成本。作为arXiv论文的常读者,我感兴趣的是这种架构拆分:将训练和推理芯片分离开来,是承认构建模型与在响应式、工具调用环境中部署模型之间存在迥异计算需求的选择。智能体系统更多地受限于延迟和内存带宽,而非原始浮点运算能力,因此一款针对推理优化的TPU,能够处理动态图与长上下文推理,可能成为真正的差异化优势。谷歌将为其自己的Gemini模型提供动力,也向第三方提供该芯片,这意味着他们正在复制AWS Nitro的策略——不仅销售计算能力,还构建一个垂直堆栈,从而增加迁移黏性。英伟达在软件生态系统和广泛模型支持方面仍占据巨大领先优势,但谷歌的举措是一项长期对冲,可能使市场碎片化,并迫使英伟达在蛮力之外展开竞争。智能体化转型是真实存在的——LangChain的普及、OpenAI的函数调用、Anthropic的工具使用——而胜出的硬件将是能最小化这些循环摩擦的那一方。这是AI芯片战争第二战线的开幕信号,战斗焦点是延迟与成本,而非仅仅是每秒万亿次浮点运算。.
#TPU
#Google
#AI chips
#hardware
#Nvidia
#inference
#training
#custom silicon
#cloud computing
#AI agents
#editorial picks

保持知情,明智行动。

获取每周精选、重要头条和专家见解 — 然后在我们的实时预测市场中运用您的知识。

评论
Empty comments
这里很安静...留下第一条评论开始对话吧。
© 2026 Outpoll Service LTD. 保留所有权利。
关注我们: