Notícias
ai
Google Revela Duas Novas TPUs para a Era dos Agentes

AIchips & hardwareGoogle TPU

Google Revela Duas Novas TPUs para a Era dos Agentes

há 1 mês7 min de leitura

O evento Google Cloud Next 2026 trouxe uma grande mudança de hardware que sinaliza uma recalibração deliberada no campo de batalha da infraestrutura de IA. A empresa revelou duas novas Unidades de Processamento Tensor — uma para treinamento, outra para inferência — que são explicitamente arquitetadas para o que chamam de "era dos agentes", onde os modelos não apenas geram texto, mas raciocinam, planejam e manipulam ferramentas externas em tempo real.Isso é um ataque direto ao domínio da Nvidia no mercado de aceleradores, e não se trata apenas de desempenho; trata-se de economia. O custo de executar clusters baseados em Nvidia para cargas de trabalho de agentes tornou-se astronômico, e a Google aposta que chips projetados sob medida, fabricados em parceria com a Marvell para o lado da inferência, podem oferecer melhor custo total de propriedade para clientes de nuvem.O que me interessa, como alguém que lê os artigos do arXiv, é a divisão arquitetônica: separar o silício de treinamento e inferência é uma escolha que reconhece os perfis computacionais divergentes de construir um modelo versus implantá-lo em um ambiente reativo e com chamadas de ferramentas. Sistemas de agentes são limitados mais pela latência e largura de banda da memória do que por FLOPs brutos, então uma TPU otimizada para inferência que possa lidar com grafos dinâmicos e raciocínio de contexto longo pode ser um verdadeiro diferencial.A Google alimentará seus próprios modelos Gemini e também oferecerá o silício a terceiros, o que significa que estão tentando replicar o manual da AWS Nitro — não apenas vendendo computação, mas construindo uma pilha vertical que torna a migração pegajosa. A Nvidia ainda tem uma enorme vantagem em ecossistema de software e suporte amplo a modelos, mas a jogada da Google é um hedge de longo prazo que pode fragmentar o mercado e forçar a Nvidia a competir em mais do que apenas força bruta.A mudança para agentes é real — adoção do LangChain, chamadas de função da OpenAI, uso de ferramentas da Anthropic — e o hardware que vencer será aquele que minimizar o atrito desses loops. Este é o primeiro tiro em uma segunda frente da guerra de chips de IA, e está sendo travada em latência e custo, não apenas em teraflops.

#TPU

#Google

#AI chips

#hardware

#Nvidia

#inference

#training

#custom silicon

#cloud computing

#AI agents

#editorial picks

Mantenha-se informado. Aja com inteligência.

Receba destaques semanais, manchetes importantes e insights de especialistas — e então coloque seu conhecimento em prática em nossos mercados de previsão ao vivo.

Seguir Inscrever-se

Notícias relacionadas

há 1 mês

EUA já estudaram o uso de bombas nucleares para construir canais

há 1 mês

Self-Flow dos Black Forest Labs torna o treinamento de IA 2,8 vezes mais eficiente

há 1 mês

Bitcoin cai 5%, despencando abaixo de US$ 65.000 com aumento de vendas de baleias e compradores recentes registrando perdas

há 1 mês

Os novos BMW i7 oferecem maior autonomia e carregamento mais rápido para 2026.

há 1 mês

Bitcoin desliza 5%, caindo abaixo de US$ 65.000 com crescimento da venda por baleias e compradores recentes registrando perdas

há 1 mês

CEO da OpenAI, Sam Altman, é atacado em casa por medos em relação à IA

Hottesthá 1 mês

Mozilla: IA da Anthropic encontrou 271 zero-days no Firefox

há 1 mês

Investidores americanos de criptomoedas estão assustados e confusos com as novas regras fiscais do IRS deste ano

há 1 mês

Sem acordo com o Irã': Trump exige rendição incondicional, fazendo o petróleo disparar, o bitcoin e as ações caírem

há 1 mês

Bitcoin cai 5%, despencando abaixo de US$ 65.000 com aumento de vendas por baleias e recém-chegados registrando perdas

há 1 mês

Bitcoin cai 5%, despenca abaixo de US$ 65.000 com aumento de vendas por baleias e compradores recentes realizando perdas

há 1 mês

Estudo absurdo sugere que comer frutas e vegetais causa câncer

há 1 mês

Sem acordo com o Irã: Trump exige rendição incondicional, fazendo o petróleo disparar e o bitcoin e as ações caírem

há 1 mês

IPO da SpaceX alerta que centros de dados orbitais de IA podem nunca funcionar

Hottesthá 1 mês

Quase dois terços dos pais apoiam financeiramente seus filhos adultos da Geração Z

Comentários

Está tranquilo aqui...Comece a conversa deixando o primeiro comentário.