《科创板日报》11月29日讯 随着Gemini 3的横空出世,谷歌TPU从幕后走到台前。英伟达GPU的霸主地位已然有被撼动迹象。

谷歌云内部高管透露,扩大TPU的市场采用率,有望帮助公司抢占英伟达年收入份额的10%。紧接着,市场便传出“谷歌加紧向客户推销TPU”“Meta拟斥资数十亿美元购买TPU”等一系列消息。大摩分析师大胆预测,2027年谷歌TPU外销量将达到100万颗。
另一边,投资者纷纷用脚投票,表达了对英伟达GPU市场遭遇侵蚀的担忧。英伟达官方发布紧急声明,强调自家产品比ASIC拥有更高的性能、更强的通用性以及更好的可替代性。
从闭关修炼的隐世高手,到如今直通AI芯片的决赛圈,谷歌TPU的起源还要从12年前的那场“算力焦虑”说起。
▌深度学习的最优解
2013年,深度学习在谷歌内部的应用开始不断扩散,后台模型的复杂度和算力消耗规模逐渐呈指数级增长。谷歌首席科学家Jeff Dean通过计算发现,若1亿安卓用户每天使用3分钟语音转文字服务,则消耗的算力竟高达谷歌所有数据中心总算力的两倍不止。
堆砌GPU以获取算力固然是符合直觉的选项,但由于“冯·诺依曼瓶颈”的存在,导致诸如CPU和GPU等计算单元在处理深度学习中大规模矩阵乘法等特定任务时效率低下。相比之下,自研ASIC加速器可为机器学习任务定制架构,能将深度神经网络推理的总体能效降至原来的十分之一,长期来看成本更为可观。
于是在2013年底,谷歌正式启动了初代TPU项目。据报道,当时谷歌内部有三个团队投身于ASIC的研发工作,包括 Google Brain、DeepMind以及专注数据中心定制硬件开发的部门。后者的TPU最终获选,其关键成员具备多年的芯片架构设计经验。如Jonathan Ross曾参与AMD的Zen架构设计,并于后来创立了AI芯片设计公司Groq。
谷歌团队进展迅速,距立项仅过去15个月,便完成了初代TPU的设计、验证、制造,乃至在数据中心的部署。项目牵头人Norm Jouppi如此描述当时情景:“我们的芯片设计速度非常快,在没有修正错误或更改掩膜的情况下便已开始出货芯片。”
2016年,TPU迎来了它的首个“破圈时刻”:人工智能围棋程序AlphaGo击败了世界围棋冠军李世石,引发了人们对AI的广泛关注。当时AlphaGo背后正是初代TPU在提供算力支持。
研发上,重大的转折发生在2017年。这一年,谷歌团队在《Attention Is All You Need》中介绍了Transformer——一种基于注意力机制的全新深度学习架构。其计算特性与TPU设计高度适配,最终推动 TPU的战略地位从单一AI加速芯片升级为谷歌的AI基础设施底座。值此背景下,TPU v2应运而生。
同样在这一年,谷歌宣布免费开放 1000 台 Cloud TPU 供开发者和研究人员使用,进一步巩固了TPU 作为AI 基础设施底座的地位。往后的日子里,谷歌引入了大规模液冷技术,将4096颗芯片组成超节点,并利用自研的环形拓扑网络实现近乎无损的跨芯片通信。在各路“外挂”的加持下,TPU朝着更强的性能一路狂飙。
而在技术之外,谷歌也毫不悭吝地将TPU引进广告系统、搜索核心排序等赚钱产品线。在2024年的应用开发与基础设施峰会上,谷歌公开表示,TPU V6及后续版本的目标是成为“推理时代最省钱的商业引擎”。
往后的故事逐渐为人所熟知,随着TPU v7被投入人工智能训练,当今公认的最强多模态模型Gemini 3横空出世。谷歌也摇身一变,从算力芯片领域的追随者一跃成为市场眼中的AI新王。人们不禁好奇,十年磨一芯,谷歌究竟做对了什么?
▌难以复制的生态护城河
回顾谷歌的造芯故事,里面没有通往AGI的宏大愿景,也没有遵循Scaling Law的绝对指引,而是始终紧扣一项更符合商业逻辑,也更显务实的指标——成本。
如果深究,则TPU的历史可以一直追溯到2006年,那时谷歌便开始考虑为神经网络构建ASIC的可能性。只不过由于当时互联网正处于爆发前夜,谷歌数据中心的GPU算力仍有大量冗余,相关需求并不迫切,因此并未透支额外成本来实际推进这一计划。
这种“量体裁衣”的理念甚至体现在TPU的设计架构本身。与GPU不同,TPU采用极简的“脉动阵列”架构,这虽然付出了放弃硬件通用性的代价,但也意味着能够剥离掉一切无关硬件,从而保证在最小单位追求深度学习的最大效率。
现如今,这种设计架构显然为谷歌带来了远超“节省成本”的回报,即与其他顶尖AI厂商掰手腕的资本。
更重要的意义在于,与其他厂商严重依赖外部算力和云设施不同,谷歌以TPU为底座的垂直整合路线,构建出了“芯片-云-模型-应用”的全栈AI能力链条。正如券商分析师们所言,这令其形成了难以复制的生态护城河,也赢得了定义未来AI基础设施的入场券。
原创:深眸财经(chutou0325) 7月30日凌晨,OpenAI推出的ChatGPT Study学习模式一经发布,就引起了国内市场的关注。 其采用交互式提示、支架式回应、个性化教育、知识点检查四种...
今年1月,DeepSeek以其低成本、强大的人工智能模型震惊了全球科技行业。 此后,阿里工程师取消了休假,在春节期间加班加点弥补差距。 阿里巴巴董事长蔡崇信周三在巴黎举行的VivaTech大会上表示,...
为在这一蓝海中掌握先发优势,海内外企业皆摩拳擦掌。 今年3月,被业内称作“英伟达亲儿子”的AI基础设施企业CoreWeave上市,这家依托英伟达GPU资源冲击新云市场的创企,市值在IPO后的两个月从2...
编者按:自1月20日DeepSeek R1爆火以来,过去100天的大模型世界中,DeepSeek成了当之无愧的顶流明星。DeepSeek不仅展现了中国AI的力量,也在一定程度上影响了世界AI发展的方...
6月26日,正和岛2025案例共学年会暨AI+先行者创新大集在合肥举办,本次大会以“向新力”为主题,千余位企业家共同探讨AI时代下的组织变革与商业格局。 大会现场,维智科技创始人、上海正和岛常务主委陶...
本篇为《为什么日本出不来DeepSeek》的下篇。在此笔者将介绍两家在日本虽在头部,却又十分另类的AI公司,以及日本AI产业背后的推动者们。 想要勾勒出日本AI行业的面貌着实不太容易。AI公司又少又慢...