首页>>科技 >>内容

Cloudflare Gen 12服务器揭晓高TDP 1U服务器没有前进的道路

发布时间:2023-12-28 09:12:53编辑:可爱的眼神来源:

在当前的计算市场中,公司之间开发具有人工智能功能的机器的竞争日益激烈。挑战不在于谁能建造出最大、最糟糕的机器;而在于谁能制造出最大、最糟糕的机器。谁能制造出最高效的机器。

Cloudflare Gen 12服务器揭晓高TDP 1U服务器没有前进的道路

当服务器运行人工智能流程时,它们会产生大量的热量,比运行标准业务流程和服务的普通服务器还要多。因此,设计包含这些服务器的系统的工程师必须考虑更强大的冷却和热交换组件。

CPU 插槽使用的电量与系统满负载时设计的散热量之间存在关系。这称为热设计点或 TDP。公司使用 TDP 作为指导,确保他们在服务器中使用最强大的芯片,同时设计物理效率最高的盒子和板卡,以实现大型数据中心环境中的密度。盒子越大,对散热的影响就越大。然而,这会导致数据中心服务器密度的损失。这是一种微妙的平衡。

随着其最新一代计算服务器的推出,Cloudflare 似乎遇到了这种关系的上限。当他们正在规划第 12 代服务器的设计时,他们发现不再可行,塞满最新的 AMD EPYC x86 处理器及其所有配件,尤其是所需的 8 个 40 毫米双转子风扇,这些风扇可以在这个级别运行任何设备。他们的Workers AI计划将使他们以 100% 的工作周期全职运行。

尽管您可以增加服务器的物理尺寸以容纳更大的风扇和 CPU 散热片来散热,但这种方法很快就会变得低效。

假设您在数据中心部署了一个 40 kW 机柜。在风冷系统中,输入机柜的能量中高达 30% 可能会用于为服务器风扇供电。这意味着该机柜的实际计算能力仅约为 28 kW。相比之下,由液体冷却系统支持的同一机柜可以将多达 39 kW 的功率专门用于计算工作负载。简而言之,液体冷却可以让您以相同的功率做更多的事情。

此外,由于水的热容量比空气高 4 倍,因此这些新型液冷服务器可以支持更高箱数、更快的处理器,同时具有更低的功耗要求和更高的可靠性。通过用更高效的液体冷却替代或补充传统的空气冷却,可以提高数据中心的整体运行效率。

事实证明,戴尔数据中心的液体冷却技术可将冷却和能源效率提高 50-60% 。如果 Cloudflare 停止发展其物理设备并拥抱液体冷却革命,它将加入系统设计者的行列,成功地压缩存储和计算能力,同时降低总体拥有和运营成本。