Google I/O 2024惊艳发布:第六代Trillium TPU助力Gemini 2.0
在今年的Google I/O 2024开发者大会上,谷歌科技再次刷新了人工智能计算领域的新高度,发布了第六代Tensor Processing Unit(TPU),命名为Trillium。这款最新的TPU代表了谷歌在高性能与节能技术方面取得的最新进展,其被专门设计来支持并推动谷歌新推出的Gemini 2.0模型,无论是在训练还是推理任务上都将提供无与伦比的支持。
Trillium TPU是迄今为止谷歌最为强大的AI计算加速器。相较于上一代TPU v5e,Trillium每芯片峰值计算能力提高了约4.7倍。更令人瞩目的是,谷歌将这款TPU的高带宽内存(High Bandwidth Memory, HBM)容量翻倍,并且晶片间互连网络(Interchip Interconnect, ICI)带宽也得到了加倍,这些改进显著增强了处理速度和数据交换效率。
在能源效率方面,Trillium超越了其前代产品TPU v5e高出67%的标准,这在当今AI训练所需的巨大能源消耗中显得尤为重要。这不仅意味着在进行大规模AI训练时能够节省更多能源,更减少了运营成本,每美元的训练性能提高了2.5倍,推理性能也提升了1.4倍。
更引人注目的是,Trillium的部署规模前所未有,谷歌在其Jupiter网络架构下连接了超过10万个Trillium TPU,目标是打造全球最强大的AI超级计算机。随着AI技术的迅速发展,技术巨头之间的“AI军备竞赛”日趋激烈。尽管NVIDIA的GPU解决方案在市场上仍占据主导地位,但谷歌通过Trillium这类定制化加速器在特殊工作负载下展现出无可比拟的性能优势,特别是在训练大型语言模型时更是如此。
总的来说,Trillium TPU的发布不仅标志着谷歌在人工智能领域的又一次技术飞跃,也为全球AI研究和应用的未来提供了更加坚实的计算基础。随着这款强大的加速器正式向Google Cloud客户提供,相信很快我们就能见证更多由Gemini 2.0模型驱动的创新应用诞生。
- Intel Xeon:数据中心
- NVIDIA GPU:图形处理
- AMD EPYC:服务器处理
- Qualcomm Snapdragon:移动计算
- IBM Power Systems:高性能计算
- ARM Cortex:嵌入式系统