英伟达市值超3.6万亿，巨头开囤GPU

发布日期：2024-11-13 21:50 点击次数：189

英伟达高出苹果成为大师最值钱的公司，而市集依旧对英伟达保执乐不雅。

与此同期，好意思国科技公司的就业器集群时时曝光。年关将至，巨头们启动展示我方的AI肌肉，试图在年底给投资者们少量甜头。

就在埃隆·马斯克xAI集群初次曝光后，小扎也迫不足待在Meta的功绩发布会上示意，Llama 4背后就业器集群的实力“比我见过的任何报说念中其他东说念主正在作念的（限制）要大”。这番言论无疑是对埃隆·马斯克“地表最强的AI集群”的正面回复。

在科技巨头们开启算力竞赛期间，英伟达的GPU成为巨头们的“粮草”。本文就来望望英伟达的大客户们AI之战的囤粮情况。

巨头血拼H100

“前”地表最强——xAI

2023年7月14日，马斯克在个东说念主推特账号晓示新公司命名为xAI，并于同日举行Twitter空间会议。新诞生的xAI公司会与Twitter和特斯拉良好配合，其中一个宗旨是打造能进行高阶逻辑推理的东说念主工智能模子，并高出市面上其他模子。

四个月后，xAI晓示推出Grok，称此模子“最大甩手地造福全东说念主类，并将是任何东说念主的雄伟的接头助理。”

2024年9月xAI推出Colossus 100k H100 检修集群。马斯克在 X 上称，它是“寰宇上最雄伟的东说念主工智能检修系统。此外，它的限制将在几个月内翻一番，达到 200k（50k H200x）。”

2024年10月，埃隆·马斯克的新形态 Colossus AI超等盘算机第一次被忽闪先容。一则视频展示了其包含10万台GPU集群的里面结构。Colossus 的基本构建模块是 Supermicro 液冷机架。它由 8 台 4U 就业器组成，每台就业器配备 8 个 NVIDIA H100，每台机架统统有 64 个 GPU。8 台这么的 GPU 就业器加上一台Supermicro 冷却液分派单位 (CDU)和关联硬件组成了一个 GPU 盘算机架。每个HGX H100之间齐夹有1U歧管，为就业器提供所需的液体冷却。每个机架底部还有另一个Supermicro 4U单位，配备的是冗余泵系统和机架监控系统。

Meta：购买35万个H100

正如前文所说，在Colossus AI盘算机视频流出后，埃隆·马斯克的“死雠敌”扎克伯格在Meta的功绩发布会上示意我方家的GPU比现在公开的数目齐多。

年头，扎克伯格在Instagram上发表著作称，接洽在本年年底前向芯片遐想商英伟达购买35万个H100 GPU芯片。Meta首席科学家杨立昆（Yann LeCun）上个月在旧金山举行的一次行为中强调了GPU关于构建通用东说念主工智能（AGI）的垂危性。他说：“如若你以为AGI期间正在到来，你就必须购买更多的GPU。这是一场东说念主工智颖悟戈，而英伟达正在提供刀兵。”

据业内东说念主士先容，每个英伟达H100芯片售价为25000至30000好意思元。那么购买35万个H100的成本在87.5亿之间到105亿好意思元之间。如若按照每个就业器配备8个GPU的数据估算，Meta将建造逾越4.3万台就业器；现在市集配备一台就业器的价钱在27万好意思金足下，那么2024年Meta的在就业器的开导成本约略是118亿好意思元。此外，还要配备相应的存储、相聚、供电、厂房等等其他设施；从成本结构来看（按就业器开导成本占比30%估算），如若Meta在2024年购买的35万个H100一起如期到货，且参加使用，那么Meta为H100搭建的数据中心投资展望逾越350亿好意思元（还不包括后续运营成本）。认识扎克伯格但愿用35万个H100芯片为Meta的Llama 4 带来更强的推理才气和更快的速率。

据估算10万个H100的算力峰值不错飙升到198/99 FP8/FP16 ExaFLOPS。开首：semianalysis，半导体产业纵横调研

微软：2023年最大买主

阐述Omdia Research的分析，2023年英伟达的H100大多供应给了大型云就业商。该机构推测，2023年H100最大的买家即是微软和Meta，展望为15万个。

来到2024年，微软将AI芯片的囤货宗旨提到了180 万块，且将主要来自英伟达。business inside示意，到 2027 财年，微软展望将在 GPU 和数据中心上破耗约 1000 亿好意思元。微软的AI芯片宗旨认识不全是H100，但这么的数字也足以见得微软对英伟达的“高需求”。

亚马逊&谷歌：一边买，一边造

联系于本文提到的其他三家公司，亚马逊和谷歌在购买GPU采购上相对低调。

事实上亚马逊在2023年7月就也曾晓示推出基于H100 GPU的造谣机实例EC2 P5。P5 实例不错组合成称为 UltraScale 的 GPU 集群，提供高达 20 百亿亿次浮点运算的总体性能。每个 UltraScale 集群中可彭胀多达 20,000 个 H100 GPU。用户不错部署可彭胀到数十亿或数万亿个参数的 ML 模子。

相同在2023年，谷歌也推出了承载26,000 个英伟达H100 GPU 的 A3 超等盘算机。A3 最大可提供 26 ExaFlops 的解决才气，可权臣减少检修大型机器学习模子的所需时候与成本。若用在 AI 推理，A3 的生效更为权臣，若以 A2 的运算效力为基准，A3 最初幅度可达到 30 倍。

四肢云巨头，亚马逊和谷歌为安在H100的采购上有如斯大的数目差距？

一个垂危原因是，这两家巨头齐在“偷偷”发力自研芯片。

亚马逊开发的AI专用芯片包括Inferentia和Trainium。据亚马逊方面示意，在亚马逊的促销日历间，该公司部署了80000个AI芯片扩充云盘算，以应付其平台上行为的激增。此外，AWS盘算和相聚副总裁戴维·布朗(David Brown)知道：“在某些情况下，该芯片性能相较英伟达可提升40%至50%，因此其成本应该是使用英伟达运行交流型号的一半。”

谷歌TPU 是定制遐想的 AI 加快器，针对大型 AI 模子的检修和推理进行了优化。它们相称得当各式使用场景，举例聊天机器东说念主、代码生成、媒体本色生成、合谚语音、视觉就业、推选引擎、个性化模子等等。Cloud TPU 能够针对各式 AI 职责负载（涵盖检修、微吞并推理）进行经济高效的扩缩。Cloud TPU 提供了多种功能，可加快最初 AI 框架（包括 PyTorch、JAX 和 TensorFlow）上的职责负载。通过 Google Kubernetes Engine (GKE) 中的 Cloud TPU 集成，无缝编排大限制 AI 职责负载。诈骗动态职责负载转换法子同期安排整个需要的加快器，从而提升职责负载的可伸缩性。寻求最通俗的 AI 模子开发法式的客户还不错在全托管式 AI 平台 Vertex AI 中诈骗 Cloud TPU。

背后赢家英伟达

英伟达在2023年为H100定下的销售宗旨是2024年出货150万至200万台。

阐述英伟达财报，2024年第二季度营收杀青翻倍，其中四个大客户的采购占比占英伟达300亿好意思元生意额的46%。出于竞争原因，对四家客户的身份进行匿名解决。在英伟达公布备受期待的季度投资者讲述时提交的10-Q监管陈诉文献骄贵，四家客户孝敬的生意额约为138亿好意思元。时长意象。四家东说念主工智能巨头可能就在亚马逊、Meta、微软、Alphabet、OpenAI或特斯拉+xAI之间产生。

微软、Alphabet(谷歌母公司)、亚马逊和Meta，四家公司第三季度在数据中心开导和其他固定钞票上统统参加了590亿好意思元，创下了季度记载。这意味着英伟达有望在本季度也交出一张漂亮的答卷。

除了以上巨头，苹果、OpenAI、中国互联网大厂齐是英伟达的垂危买家，基于这么的配景。华尔街分析师对英伟达的认识相称乐不雅，机构跟踪的75位分析师中有67位将该股评为“买入”。他们还在连接提升预期，阐述汇编的数据，往常三个月，他们对来岁的利润预测提升了约10%。

2024年11月8日，英伟达市值侵略3.6万亿好意思元，刷新了好意思股历史。在11月份，英伟达股价也曾累计上升了12%，2024年年头于今，该公司市值也曾增长了两倍。

2024年11月8日英伟达市值

AI改变芯片市集

11月1日，标普说念琼斯指数公司公布，将英伟达纳入说念琼斯工业平均指数，取代说念指现在的芯片业因素股英特尔。此次调节记号着东说念主工智能和高性能盘算的垂危性日益增强。英伟达四肢AI GPU的最初供应商，能够眩惑更多投资者善良新兴时期，传统的半导体公司则靠近较大压力，尤其是在数据解决、AI模子检修等高增长规模。

固然，这么的调节更评释AI正在指点市集投资风向。

上周巨头功绩后，各家投行不息上调了来岁举座本钱开支。大摩从2700亿好意思金上调到3000亿好意思金。3000亿好意思金，四肢对比先后完成6次登月的阿波罗登月接洽共破耗239.15亿好意思元；3000亿好意思金的数字不错在2023年非洲国度GDP排行中位列第4，仅低于埃及（3939亿好意思元）、南非（3777亿好意思元）、尼日利亚（3749亿好意思元）。

在东说念主们叹息英伟达期间莅临的时候，或然应该意志到AI期间确切来了。

AI树立了英伟达，AI期间并不会只属于英伟达。凯文凯利在《5000天后的寰宇》中预测：在畴昔的50年里，AI将成为不错与自动化和产业翻新同等看待的，不，应该是影响更为潜入的趋势。

一个新期间，将会由一个新玩家建造。

上一篇：交银海外证券：赐与伊利股份买入评级，目的价位33.3元

下一篇：两融余额暴增至1.8万亿以上，推动A股高涨的增量资金在那处？

让建站和SEO变得简单

英伟达市值超3.6万亿，巨头开囤GPU