TPU直通决赛圈!十年磨一芯 谷歌做对了什么?

客服微996438431周前财经知识14

《科创板日报》11月29日讯 随着Gemini 3的横空出世,谷歌TPU从幕后走到台前。英伟达GPU的霸主地位已然有被撼动迹象。

TPU直通决赛圈!十年磨一芯 谷歌做对了什么?

谷歌云内部高管透露,扩大TPU的市场采用率,有望帮助公司抢占英伟达年收入份额的10%。紧接着,市场便传出“谷歌加紧向客户推销TPU”“Meta拟斥资数十亿美元购买TPU”等一系列消息。大摩分析师大胆预测,2027年谷歌TPU外销量将达到100万颗。

另一边,投资者纷纷用脚投票,表达了对英伟达GPU市场遭遇侵蚀的担忧。英伟达官方发布紧急声明,强调自家产品比ASIC拥有更高的性能、更强的通用性以及更好的可替代性。

从闭关修炼的隐世高手,到如今直通AI芯片的决赛圈,谷歌TPU的起源还要从12年前的那场“算力焦虑”说起。

深度学习的最优解

2013年,深度学习在谷歌内部的应用开始不断扩散,后台模型的复杂度和算力消耗规模逐渐呈指数级增长。谷歌首席科学家Jeff Dean通过计算发现,若1亿安卓用户每天使用3分钟语音转文字服务,则消耗的算力竟高达谷歌所有数据中心总算力的两倍不止。

堆砌GPU以获取算力固然是符合直觉的选项,但由于“冯·诺依曼瓶颈”的存在,导致诸如CPU和GPU等计算单元在处理深度学习中大规模矩阵乘法等特定任务时效率低下。相比之下,自研ASIC加速器可为机器学习任务定制架构,能将深度神经网络推理的总体能效降至原来的十分之一,长期来看成本更为可观。

于是在2013年底,谷歌正式启动了初代TPU项目。据报道,当时谷歌内部有三个团队投身于ASIC的研发工作,包括 Google Brain、DeepMind以及专注数据中心定制硬件开发的部门。后者的TPU最终获选,其关键成员具备多年的芯片架构设计经验。如Jonathan Ross曾参与AMD的Zen架构设计,并于后来创立了AI芯片设计公司Groq。

谷歌团队进展迅速,距立项仅过去15个月,便完成了初代TPU的设计、验证、制造,乃至在数据中心的部署。项目牵头人Norm Jouppi如此描述当时情景:“我们的芯片设计速度非常快,在没有修正错误或更改掩膜的情况下便已开始出货芯片。”

2016年,TPU迎来了它的首个“破圈时刻”:人工智能围棋程序AlphaGo击败了世界围棋冠军李世石,引发了人们对AI的广泛关注。当时AlphaGo背后正是初代TPU在提供算力支持。

研发上,重大的转折发生在2017年。这一年,谷歌团队在《Attention Is All You Need》中介绍了Transformer——一种基于注意力机制的全新深度学习架构。其计算特性与TPU设计高度适配,最终推动 TPU的战略地位从单一AI加速芯片升级为谷歌的AI基础设施底座。值此背景下,TPU v2应运而生。

同样在这一年,谷歌宣布免费开放 1000 台 Cloud TPU 供开发者和研究人员使用,进一步巩固了TPU 作为AI 基础设施底座的地位。往后的日子里,谷歌引入了大规模液冷技术,将4096颗芯片组成超节点,并利用自研的环形拓扑网络实现近乎无损的跨芯片通信。在各路“外挂”的加持下,TPU朝着更强的性能一路狂飙。

而在技术之外,谷歌也毫不悭吝地将TPU引进广告系统、搜索核心排序等赚钱产品线。在2024年的应用开发与基础设施峰会上,谷歌公开表示,TPU V6及后续版本的目标是成为“推理时代最省钱的商业引擎”。

往后的故事逐渐为人所熟知,随着TPU v7被投入人工智能训练,当今公认的最强多模态模型Gemini 3横空出世。谷歌也摇身一变,从算力芯片领域的追随者一跃成为市场眼中的AI新王。人们不禁好奇,十年磨一芯,谷歌究竟做对了什么?

▌难以复制的生态护城河

回顾谷歌的造芯故事,里面没有通往AGI的宏大愿景,也没有遵循Scaling Law的绝对指引,而是始终紧扣一项更符合商业逻辑,也更显务实的指标——成本。

如果深究,则TPU的历史可以一直追溯到2006年,那时谷歌便开始考虑为神经网络构建ASIC的可能性。只不过由于当时互联网正处于爆发前夜,谷歌数据中心的GPU算力仍有大量冗余,相关需求并不迫切,因此并未透支额外成本来实际推进这一计划。

这种“量体裁衣”的理念甚至体现在TPU的设计架构本身。与GPU不同,TPU采用极简的“脉动阵列”架构,这虽然付出了放弃硬件通用性的代价,但也意味着能够剥离掉一切无关硬件,从而保证在最小单位追求深度学习的最大效率。

现如今,这种设计架构显然为谷歌带来了远超“节省成本”的回报,即与其他顶尖AI厂商掰手腕的资本。

更重要的意义在于,与其他厂商严重依赖外部算力和云设施不同,谷歌以TPU为底座的垂直整合路线,构建出了“芯片-云-模型-应用”的全栈AI能力链条。正如券商分析师们所言,这令其形成了难以复制的生态护城河,也赢得了定义未来AI基础设施的入场券。

相关文章

明年起5纳米以下先进制程至少涨3%?台积电回应:定价策略不以机会导向

明年起5纳米以下先进制程至少涨3%?台积电回应:定价策略不以机会导向

台积电再传涨价消息。 近日,有消息称,台积电从9月起陆续通知客户,决定自2026年1月起,5纳米以下的先进制程将执行连续四年的涨价计划,报价平均涨幅约3%-5%。这是台积电罕见采取的长期调价策略,显示...

高盛刷屏!寒武纪,突传大消息!

高盛刷屏!寒武纪,突传大消息!

目标价再度被拔高! 今天早上七点,署名为“高盛”(Goldman Sachs)的研报在市场流传。该研报指出,仍对寒武纪持积极态度,上调12个月目标价14.7%至2104元/股(隐含2030年预期市盈...

刚刚,上海闯出AI芯片龙头,全球第一!

刚刚,上海闯出AI芯片龙头,全球第一!

一个木桶能装多少水,取决于最短的那块木板。 同样的,一台AI服务器到底能提供多少算力,也并非只听AI芯片一家之言。 AI芯片,如GPU、CPU、AI加速卡等,负责处理海量的数据,这不假。但前提是其能...

液冷服务器概念持续走强,“黑马”银轮股份股价悄然翻倍

液冷服务器概念持续走强,“黑马”银轮股份股价悄然翻倍

8月15日,A股液冷服务器概念早盘走强。 其中,金田股份(601609.SH)、东阳光(600673.SH)、大元泵业(603757.SH)触及涨停,川环科技(300547.SZ)、欧陆通(30087...

高盛“唱高”寒武纪目标价至2104元!这次市场为何没跟进

高盛“唱高”寒武纪目标价至2104元!这次市场为何没跟进

在寒武纪(688256.SH)成为资本市场关注焦点之际,高盛时隔一周左右第二次上调寒武纪目标价至2104元。而寒武纪的“股王”之位坐得并不稳,9月1日早盘股价下跌,再度落后于贵州茅台(600519.S...

深南电路,不装了!

深南电路,不装了!

狭路相逢,勇者胜。 过去6年,随着下游应用爆发,PCB(印制电路板)企业多次进入贴身肉搏的焦灼状态。 而“胜利者”往往是那些敢于迎接挑战的公司。深南电路,就算一个。 2019-2020年,全球5G基...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:BT86616点击复制并跳转微信