性能飙升4倍!谷歌最强AI芯片突袭英伟达?

放大招了!

近来,全球搜索引擎霸主大动作频频。

谷歌最新宣布,公司迄今为止最强大的芯片 lronwood即将问世。

不过周四美股开盘,市场对此反应平淡。美股七姐妹高开低走,谷歌-C现跌0.31%,最新市值3.43万亿美元。


未来几周内上市


AI大模型部署需求激增巨头们的竞争日益加剧。

美东时间周四,谷歌表示其最强芯片Ironwood将在未来几周内上市。

据称,TPU已经开发了十年。lronwood 是谷歌的第七代张量处理单元(TPU),最初于4月份推出进行测试。

这款自主研发的芯片旨在处理从大型模型训练到驱动实时聊天机器人和人工智能代理等各种任务。

其通过将多达 9216 个芯片集成到单个芯片组中,新型 Ironwood TPU 消除了“最苛刻模型的数据瓶颈”,并使客户“能够运行和扩展现有规模最大、数据密集型的模型”。

单个 Ironwood“模块”传输速度高达每秒 9.6 太比特。这种庞大的互连架构使9216颗芯片能够共享1.77PB的高带宽内存,这相当于约4万部高清蓝光电影的工作内存,可供数千个处理器同时即时访问。

谷歌在技术文档中指出:“作为参考,这意味着Ironwood Pods的FP8 ExaFLOPS性能是其最接近的竞争对手的118倍。”

当前,谷歌正与微软、亚马逊和Meta等竞争对手展开一场激烈的竞赛,力图构建未来的人工智能基础设施

虽然大多数大型语言模型和人工智能工作负载都依赖于英伟达的图形处理器(GPU),但谷歌的TPU属于定制芯片,在价格、性能和效率方面都具有优势。

谷歌云人工智能与基础设施副总裁兼总经理Amin Vahdat表示:

“包括谷歌的Gemini、Veo和Imagen以及Anthropic的Claude在内的当今前沿模型,都在张量处理单元(Tensor Processing Unit)上进行训练和运行。对许多组织而言,重点正从训练这些模型转向如何利用这些模型实现有用且响应迅速的交互。”


剑指英伟达?


据悉,Ironwood芯片速度比上一代产品快4倍以上,而且已经有不少大型客户预订。

人工智能初创公司 Anthropic 计划使采购 100 万个新型TPU芯片来运行其 Claude 模型。

这项价值数百亿美元的合作,将是迄今为止规模最大的人工智能基础设施交易之一。

Anthropic 的计算主管 James Bradbury 称,Ironwood 在推理性能和训练可扩展性方面的改进将帮助其高效扩展,同时保持客户期望的速度和可靠性。

除了这款新芯片,谷歌还推出了一系列升级,旨在使其云服务更便宜、更快、更灵活,以与规模更大的云服务提供商亚马逊网络服务 (AWS) 和微软 Azure 展开竞争。

随着全球科技竞赛白热化,华尔街巨头们正疯狂使出浑身解数。

尽管英伟达高达 80% 至 95%的市场份额保持着绝对优势,但云服务商们正加大对定制芯片的投资,以实现产品差异化并提升单位经济效益。

其中,亚马逊推出了基于Arm架构的Graviton CPU和Inferentia / Trainium人工智能芯片;微软开发了Cobalt处理器,据说还在研发人工智能加速器。

目前,谷歌在主要云服务提供商中拥有最全面的定制芯片产品组合。

上周发布的财报显示,谷歌第三季度云计算收入达151.5亿美元,同比增长34%。其中,Azure收入增长40%,亚马逊AWS收入增长20%。

谷歌表示,2025年前九个月签署的十亿美元级云计算交易数量超过了过去两年的总和。

为了满足激增的需求,谷歌将今年的资本支出预测上限从850亿美元上调至930亿美元。

谷歌CEO桑达尔·皮查伊在财报电话会议上表示,市场对其人工智能基础设施产品,包括基于TPU和GPU的解决方案,有着巨大的需求。

“这是我们过去一年增长的关键驱动力之一,我认为展望未来,我们将继续看到非常强劲的需求,我们正在加大投资以满足这一需求。”
格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论