AIchips & hardwareGoogle TPU
Google Luncurkan Dua TPU Baru untuk Era Agen
BA
Bayu Wicaksono
1 minggu yang lalu7 menit baca
Acara Google Cloud Next 2026 menghadirkan perubahan besar pada perangkat keras yang menandakan kalibrasi ulang secara sengaja dalam medan pertempuran infrastruktur AI. Mereka telah meluncurkan dua Unit Pemrosesan Tensor baru—satu untuk pelatihan, satu untuk inferensi—yang secara eksplisit dirancang untuk apa yang mereka sebut sebagai "era agen," di mana model tidak hanya menghasilkan teks tetapi juga bernalar, merencanakan, dan memanipulasi alat eksternal secara real-time.Ini adalah serangan langsung terhadap cengkeraman Nvidia di pasar akselerator, dan ini bukan hanya tentang kinerja; ini tentang ekonomi. Biaya menjalankan klaster berbasis Nvidia untuk beban kerja agen telah menjadi sangat besar, dan Google bertaruh bahwa chip yang dirancang khusus, diproduksi bersama dengan Marvell untuk sisi inferensi, dapat memberikan TCO yang lebih baik bagi pelanggan cloud.Yang menarik bagi saya sebagai seseorang yang membaca makalah arXiv adalah pemisahan arsitektural: memisahkan silikon pelatihan dan inferensi adalah pilihan yang mengakui profil komputasi yang berbeda antara membangun model versus menerapkannya dalam lingkungan reaktif yang memanggil alat. Sistem agen terhambat oleh latensi dan bandwidth memori jauh lebih banyak daripada FLOP mentah, sehingga TPU yang dioptimalkan untuk inferensi yang dapat menangani grafik dinamis dan penalaran konteks panjang bisa menjadi pembeda yang sesungguhnya.Google akan mendukung model Gemini miliknya sendiri dan juga menawarkan silikon tersebut kepada pihak ketiga, yang berarti mereka mencoba meniru buku pedoman AWS Nitro—tidak hanya menjual komputasi tetapi membangun tumpukan vertikal yang membuat migrasi menjadi lengket. Nvidia masih memegang keunggulan besar dalam ekosistem perangkat lunak dan dukungan model yang luas, tetapi langkah Google adalah lindung nilai jangka panjang yang dapat memecah pasar dan memaksa Nvidia untuk bersaing tidak hanya pada kekuatan mentah.Pergeseran agen itu nyata—adopsi LangChain, pemanggilan fungsi OpenAI, penggunaan alat Anthropic—dan perangkat keras yang akan menang adalah yang meminimalkan gesekan dari putaran-putaran tersebut. Ini adalah tembakan pembuka di front kedua perang chip AI, dan ini diperjuangkan berdasarkan latensi dan biaya, bukan hanya teraflop.
#TPU
#Google
#AI chips
#hardware
#Nvidia
#inference
#training
#custom silicon
#cloud computing
#AI agents
#editorial picks
Tetap Terinformasi. Bertindak Lebih Cerdas.
Dapatkan sorotan mingguan, berita utama, dan wawasan ahli — lalu terapkan pengetahuan Anda di pasar prediksi langsung kami.
Berita Terkait
Komentar
Sepi di sini...Mulai percakapan dengan meninggalkan komentar pertama.