首页>>科技 >>内容

AMD最强芯片,全村的希望!

发布时间:2023-09-09 15:44:43编辑:温柔的背包来源:

很多朋友对AMD最强芯片,全村的希望!不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

AMD最强芯片,全村的希望!

由于GPU严重不足,英伟达收费约为制造成本的5倍,业内人士都渴望找到替代方案。虽然谷歌在AI工作负载上有结构性的性能/TCO优势,但由于其TPU拥有成熟的软硬件OCS,与其他大型科技公司相比,我们认为存在结构性的问题,会阻碍其成为对外使用的领导者。1、谷歌TPU只能在一个云中由一家公司提供。

2、谷歌不会在芯片部署后很久才发布它们,因为大买家需要在发布前录制它们,并在ramp之前提供早期访问系统。3、多年来,谷歌一直向用户隐藏着许多主要的硬件功能,包括内存/计算相关的和网络/部署灵活性。4、 Google拒绝为想要编写自定义内核以最大化性能的向导提供低级硬件文档。

谷歌在AI基础设施方面最大的技术进步的看门人将使他们在结构上落后于基于英伟达的云产品,除非谷歌改变他们的运营模式。亚马逊、微软等其他云的内部芯片还远远落后。

在商用芯片的世界里,Cerebras是目前最接近的竞争对手,它在GPT-3上稳定的开源模式令人印象深刻,但硬件可及性非常有限,每台服务器的成本高达数百万美元。在云中访问脑波强化器的唯一方法是通过他们自己的产品。缺乏准入将损害发展的灵活性。

Nvidia生态系统的生命线是人们在各种系统上开发,从他们花费数百美元的游戏GPU到数万本地GPU或与所有第三方云服务提供商合作。然而,Tenstorrent等其他初创公司表明,在硬件/软件真正大步前进之前,我们还有很长的路要走。

尽管收购了Nervana和Habana两家不同的数据中心AI硬件公司,但全球最大的商用芯片供应商英特尔却消失了。内尔瓦纳在几年前被遗弃了,现在哈瓦那似乎也发生了同样的事情。英特尔目前使用的是他们的第二代Habana Gaudi 2,除了AWS上提供的一些例子外,很少使用。此外,随着该产品被纳入2025 Falcon Shores GPU,英特尔宣布该路线图失败。

英特尔的GPU Ponte Vecchio也好不到哪里去。已经很晚了,拖延已久的极光超级计算机的交付也是最近才完成的,两年内不会有继任者。其性能通常无法与英伟达的H100 GPU抗衡。

这使得AMD成为英伟达最后一个强有力的竞争对手。

AMD是唯一一家拥有成功交付高性能计算芯片记录的公司。虽然这主要适用于他们的CPU是运行良好的执行机器,但还可以进一步扩展。AMD在2021年为世界上第一台ExaFLop超级计算机Frontier交付了HPC GPU芯片。虽然为Frontier提供动力的MI250X足以完成其主要工作,但它未能在云计算的大客户和超大规模用户中获得任何影响力。

现在,所有人都在期待AMD的MI300,它将于今年晚些时候交付给El Capitan,这是他们的第二个Exascale超级计算机获奖者。正因如此,一旦你把目光从英伟达身上移开,AMD即将推出的MI300 GPU就会成为讨论最多的芯片之一。我们也一直在关注它与Meta的PyTorch 2.0和OpenAI的Triton软件的适配前景。自从Nvidia的Volta GPU和AMD的Rome CPU以来,数据中心芯片还没有引起这么大的轰动。

代号为Aqua Vanjaram的MI300由多个复杂的硅层组成,坦率地说,这是一个工程奇迹。CEO苏姿丰在今年早些时候的CES上展示了MI300套件,让我们了解了MI300的结构。我们看到四个硅片被八个HBM叠层包围。这是HBM3的最高速度5.6 GT/s,8个16GB堆栈组成128GB统一内存,带宽5.734 TB/s.相比3.3 TB/s英伟达H100 SXM 80GB,带宽提升72%,容量提升60%。

AMD获得任何数量的人工智能来计算美元的机会最终归结为成为超大规模和Nvidia的可靠的第二来源。假设涨潮会把所有的船都举起来。当然,预计在AI数据中心基础设施上的大量支出将在某种程度上有利于AMD。AMD硬件只是AI支出热潮中的一个注脚。

事实上,目前AMD在AI基础设施建设上相对失败,因为他们在数据中心GPU上缺乏成功的安利,在HGX H100系统上缺乏CPU胜利,普遍放弃CPU支出。因此,MI300的成功至关重要。01.基本构建模块elkrange有源内插器芯片MI300的所有变体都从称为AID(有源内插器芯片)的相同基本构建模块开始,这就是所谓的有源内插器芯片。

这是一个名为Elk Range的小芯片,尺寸约为370mm,由TSMC N6工艺技术公司制造。该芯片由两个HBM内存控制器、64MB无限高速缓存、三个最新一代视频解码引擎、36通道xGMI/PCIe/CXL和AMD的片上网络(NOC)组成。在4块配置中,MALL缓存为256MB,而H100缓存为50MB。AID最重要的部分是在CPU和GPU计算上的模块化。

AMD和TSMC使用混合粘合技术将AID连接到其他小芯片。这种通过铜TSV的连接允许AMD混合和匹配CPU与GPU的最佳比例。四个辅助以超过4.3 TB/s的对分带宽相互通信,启用USR:Ultra Short Reach)物理层,如AMD Navi31 game GPU中的小芯片互连所示,虽然这次它们同时具有水平和垂直链路以及对称的读/写带宽。

方形拓扑还意味着对角线连接需要2跳,而相邻的aid需要1跳。这些辅助设备中的两个或四个(根据MI300的不同计算方式)被组合在CoWoS硅内插器的顶部。有两种不同的援助流。t图像与英特尔的Sapphire Rapids非常相似。02.计算Tiles——Banff班夫XCD和DG300杜兰戈CCD辅助可以是CPU或GPU。在GPU方面,计算小芯片被称为XCD,代号为班夫。

Banff采用TSMC N5技术制造,约115mm。虽然只启用了38个单元,但它总共包含40个单元。这个架构是从AMD的MI250X演化而来的。在GitHub上,AMD称之为gfx940,但公开称之为CDNA3。它针对计算进行了优化。虽然是“GPU”,但并不能真正处理图形。同样适用于Nvidia H100,他们的大部分GPC都不能处理图形。一般来说,每个辅助可以有2个班夫骰子,总共76个Cu。

MI300 的最大XCD/GPU 配置将提供304 个CU。作为对比,AMD MI250X 具有220 个CU。 MI300 的另一个模块化计算方面是CPU 方面。AMD 部分重用了他们的Zen 4 CCD 小芯片,尽管进行了一些修改。他们改变了一些金属层掩模,为SoIC 和AID 创建焊盘,需要重新设计一些金属掩模的新流片。这个修改过的Zen 4 CCD,GD300 Durango 禁用了GMI3 PHY。AID 的带宽明显高于GMI3。

此CCD 采用TSMC 的5nm 工艺技术,并保留与台式机和服务器上的Zen 4 CCD相同的~70.4mm 2芯片尺寸。 每个AID 可以有3 个Zen 4 小芯片,总共24 个内核。MI300的最大CCD/CPU配置可以提供多达96个核心。03.先进封装——品味未来AMD 的MI300 是世界上最令人难以置信的先进封装形式。有超过100 块硅粘在一起,全部位于使用TSMC 的CoWoS-S 技术的破纪录的3.5x 光罩硅中介层之上。

这种硅的范围从HBM 存储层到有源中介层以进行计算,再到用于结构支持的空白硅。这个巨大的中介层几乎是NVIDIA H100 上中介层的两倍。MI300 的封装工艺流程非常复杂,是行业的未来。 复杂的封装需要AMD 的重大灵活性和修改才能按时获得MI300。最初的设计是使用采用台积电CoWoS-R技术的有机再分布层(RDL) 中介层。

事实上,台积电去年确实推出了CoWoS-R测试封装,其结构与小米300有着惊人的相似之处。可能由于具有如此大尺寸的有机中介层的翘曲和热稳定性问题而改变了中介层材料。 AID 以9um 间距与SoIC gen 1 混合键合到XCD 和CCD。由于工艺不成熟,AMD 不得不放弃转向TSMC 的SoIC gen 2 的计划,该SoIC 的间距为6um 。然后将它们封装在CoW 无源中介层之上。通过这个过程有十几块支撑硅片。

最终的MI300 包含传统的倒装芯片质量回流和TCB 以及晶圆上的芯片、晶圆上的晶圆和晶圆上的重构晶圆混合键合。04.MI300 配置AMD MI300 有4 种不同的配置,但我们不确定是否所有4 种都会真正发布。 MI300A 凭借异构CPU+GPU 计算成为头条新闻,El Capitan Exascale 超级计算机正在使用该版本。MI300A 在72 x 75.4mm 基板上采用集成散热器封装,适合插槽SH5 LGA 主板,每块板有4 个处理器。

它有效地支付了开发成本。它已经出货,但真正在第三季度出现增长。标准服务器/节点将是4 个MI300A。不需要主机CPU,因为它是内置的。这是迄今为止市场上最好的HPC 芯片,并将保持一段时间。 MI300X 是AI hyperscaler 变体,如果成功,将成为真正的容量推动者。全是GPU,以实现AI 的最佳性能。AMD这里推的服务器级配置是8颗MI300X+2颗Genoa CPU。

MI300C 将走相反的方向,成为仅具有96 核Zen4 + HBM 的CPU,以响应英特尔的Sapphire Rapids HBM。然而,这个市场可能太小而且产品太贵,以至于AMD 无法生产这个变体。 MI300P 就像一半大小的MI300X。它是一种可以以较低功率进入PCIe 卡的产品。这又需要主机CPU。这将是最容易开始开发的版本,尽管我们认为它更像是2024 年的版本。

审核刘清

以上知识分享希望能够帮助到大家!