烧光70000亿美元, 以英伟达、台积电为敌

05-20 19:22

本期以山姆·奥特曼7亿美元建厂的可行性分析为重点,独家发布腾讯新闻。未经授权,请不要转载。


文 / 前台积电建厂专家 Leslie Wu(公众号:梓豪谈芯)


有朋友问:Leslie,你出生在一家专业的工厂。此前有报道称,山姆奥特曼将投资7万亿元建造核心。虽然我没有明确回应,但大媒体一定不是空穴来风。如果有7万亿,性价比高,还是买性价比高。如果是,估计应该考虑哪些投资和因素?


奥特曼“7万亿”的谣言真的是石破天惊。这个想法很有趣。我们必须有丰富的半导体工厂建设、技术和操作等一系列知识来回答这个问题。我们可以试着计算一下,如果我们持有7亿美元,我们如何“合理”地花钱?



每万片晶圆,建厂投资150亿美元


首先,第一步必须是生产GPU逻辑芯片,这样就需要先建立一个逻辑晶圆工厂。我们以台积电最先进的2nm工厂为例,看看每万个晶圆的资本投入。


按照投资额划分,晶圆厂的各种投资比例大致如下:工艺设备:77%,土地和建筑:4%,洁净室:5%,水、电、化工等供应系统设施:14%。


光刻机是晶圆厂最大的工艺设备成本项目之一,占20%左右,2nm需要使用EUV光刻机(负责25层光刻),成本相对较高,预计占24%左右。


当前台积电的2nm仍然采用低值孔径EUV,与ASML最新款NXE相对应。:晶圆3800E,每小时产生晶圆。(WPH,Wafer per hour)大约在190-200片之间,单台设备的月产能估计在2400片左右(具体计算见下表注释),这意味着每万片晶圆的产能,NXEE需要4台ASML。:3800 EUV光刻机,除EUV负责的25层外,其它层还需要3台NXT片,每小时产生晶圆295片。:2100,以及KrF DUV光刻机。


*单台设备月产能=一小时产出晶圆数*运行时间*%customerefficiency(效率)*%doseageheadwind(vs.*30天*EUV层数*30天


根据ASML提供的数据,NXE:售价约2亿美元的3800E,NXT:大约7500万美元的2100i,大约1500万美元的KrFDUV,这意味着2nm工艺的晶圆厂,每万片晶圆产能,光刻机(包括维修和配件)的投资预计在13亿美元左右。


根据光刻机投资占所有工艺设备的24%,工艺设备总投资为54亿美元,而工艺设备占晶圆厂总投资的77%,从而反推。,每万片晶圆产能,2nm节点,晶圆厂总投资约71亿美元。


晶圆产能每万片,晶圆厂总投资划分,单位:美元


GPU逻辑芯片厂建成后,还要考虑HBMDRAM厂的建设。


我们以最先进的1gamma工艺为例。虽然DRAM的EUV光刻层有所减少,但每万个晶圆所需的设备数量并没有减少,反而增加了,尤其是蚀刻设备。总体而言,1gamma工艺的DRAM工厂投资约为逻辑芯片晶圆工厂总投资的85%,即60亿美元。


另外,在DUV时代,DRAM工厂的投资大约是同级逻辑晶圆工厂的110%-120%,直到7nm节点,EUV光刻机在逻辑工厂中得到了广泛的应用,每万片晶圆产能的投资开始超过DRAM工厂。


在处理了前端的GPU逻辑芯片和DRAM存储芯片之后,还需要解决后端的封装问题,包括CoWoS先进封装和HBM封装。


当前,最先进的AI芯片选择SoIC。 HBM4将采用混合键合技术,CoWoS封装技术(Hybrid Bonding),每万个晶圆的投资将大大增加到10亿美元(包括设备厂房)。此外,先进封装涉及的中介层还需要使用DUV搭建65/45nm的前端晶圆厂,投资额为每万个晶圆8亿美元。换言之,封装部分,每万片晶圆的总投资预计在18亿美元左右。


每万片晶圆产能,不同晶圆厂单位投资,单位:美元


这一花钱工作涉及到更多的数据,帮助大家做一个小总结,每万片晶圆产能,或单位投资金额,对应2nm工艺的思路晶圆厂、1gamma工艺的DRAM厂、封装厂(先进封装厂) 中介,十亿美元 在8亿美元方面,投资总额约为150亿美元。


每年生产600万个GPU,成本500亿美元


但是,GPU逻辑芯片、HBM内存和中介层,对应的比例并非1。:1:1的关系,在单位投资的基础上,总投资总额要按指数增加。这个指数大致可以来自一个GPU,需要的CPU。、计算HBM内存、中介层总数。


GPU,英伟达最新的Blackwell架构B200的Die size(814mm²)例如,每个晶圆可以切割80个芯片。根据台积电的最佳工艺,良率约为65%,即每个晶圆可以切割50个谷歌。 Die。


此外,由于GPU逻辑芯片是一个大芯片,物镜显像的景深需要控制在相对较大的水平,以提高光刻的曝光清晰面积,这将导致分辨率下降,这是缺陷增加和良率下降的重要原因。


Gracee与英伟达的B200相匹配。 CPU,两个GPU组合一个Grace CPU,所以50个GPU,需要搭配25个CPU。根据3nm工艺计算,Die的CPU 根据Size和良率估计,一个晶圆可以切割大约300个CPU芯片,这意味着一个GPU晶圆需要与0.08个CPU晶圆相匹配。


现在3nm节点,每万片晶圆的投资是2nm节点的70%,大约50亿美元,换句话说,投资71亿美元生产10000个GPU晶圆,同时投资71亿美元×70%×用于CPU晶圆生产的0.08,即4亿美元。


HBM是AI芯片的另一个亮点,英伟达的H100。、在Blackwell架构中,H200标配6个B200,采用8个HBM3e内存。根据台积电的最新路线图,2026年,一个GPU可以与12个HBM内存相匹配,届时HBM的规格将从12层HBM3e升级到16层HBM4/4e。


如前所述,2nm晶圆可以切割50个GPU逻辑芯片,按照B200的标准,每个晶圆需要400个HBM3e内存。现在,1gamma制造的DRAM芯片,每个晶圆大约能产生1200个DRAM颗粒,而按85%的良率计算,最终可获得1000个DRAM颗粒,然后将这些DRAM颗粒封装成12层的HBM3e内存。当前,封装的良率约为80%,即一个DRAM晶圆可以产生100000÷HBM3e内存12*80%,大约等于70个上下12层。


换言之,一个GPU晶圆不仅需要0.08个CPU晶圆,还需要5.7个DRAM晶圆。未来,随着GPU逻辑芯片组合HBM颗粒数量的进一步增加,尤其是堆叠数量从12层增加到16层,GPU:DRAM晶圆1:5.7的比例,将进一步扩大。


根据目前先进封装的中介层尺寸,一个晶圆可以完成15个GPU逻辑芯片的封装,对应一个芯片。晶圆的GPU逻辑芯片,需要先进的3.3片晶圆封装。


每万片晶圆产能,不同晶圆厂的建厂投资,单位:美元


一句话总结:每个10000个GPU晶圆,需要800个CPU晶圆,57,000个DRAM晶圆,33,000个中介层晶圆,33,000个SoIC 先进的CoWoS封装,57,000个HBM封装,相应的投资,也就是1*71 0.08*50 5.7*60 3.3*10 3.3*8 5.7*10≈476亿美金。


每个10000片GPU晶圆的所有配套芯片生产厂都要花费476亿美元,加上其它杂七杂八的费用直接计算为整数。500亿美元,换算成每月50万个GPU芯片,每年600万个。


能在八年半烧完7亿美元


投资500亿美元,每年生产600万个GPU。这是什么概念?全世界的AI都可以根据台积电的CoWoS产能来计算。 在比较之前,GPU的数量。


2024年,台积电CoWoS产能达到31万片,其中95%是AICoWoS。 GPU,为Xilinx提供的FPGA只有一万多片,其余的近30万片被英伟达、AMD和Google等全球互联网大厂商,AWS,Meta,自研ASIC芯片刮分Mircosoft。


换言之,台积电CoWoS的生产能力代表了全球AI芯片的生产能力,2024年80%的GPU仍然只使用2.5。D CoWoS,英伟达的H100大约是每片29片,而其它自研ASIC则高于这一标准,有些还超过40片,目前只有AMDMI300使用SoIC封装,每片约15片。


综合下来,今年台积电的CoWoS产能达到30万个,对应的GPU约为1000万个,这是2024年全球AI。 大概GPU总量。如前所述,每年可以生产600万个GPU,投资500亿美元,换句话说,2024年,为满足全球需求,生产1000万个AI GPU,总投资需要830亿美元。这一水平相当于台积电2-3年的资本支出,也可能是台积电Fab20A,一个月产量12万片的2nm芯片厂的总投资。


投资830亿美元,可以制造出2024年全球所需的AI芯片,要花掉奥特曼的7亿美元,还有许多工作要做,毕竟830亿美元也只是建造芯片厂的费用。


晶片厂,DRAM厂、封装厂建成后,要注意生产服务器的工厂建设,还要建很多类似工业富联的工厂。然而,与芯片工厂相比,这种服务器组装工厂只是小巫见大巫,在AI服务器的所有产业链中构建所有工厂,包括服务器、光模块、液冷、铜电缆和各种模具工厂。每年生产1000万个GPU,按单个服务器8个GPU计算,即120万个服务器,下游工厂总投资约170亿美元。再加上830亿美元的上游芯片厂,1000亿美元是2024年世界上所有的AI 芯片 工厂建设总成本为服务器出货量所需。


上游和下游工厂的建设只是开始,技术需要持续的R&D投资,包括设计和制造相关的R&D费用,覆盖GPU、CPU、HBM、先进封装等阶段,这部分可以打包计算英伟达,AMD、台积电、SK海力士的R&D总额约为300亿美元。再加上服务器硬件的研发,如光模块、也冷等,研究开发部分的费用可达500亿美元。


而且对OpenAI来说,在推广AGI的道路上,还需要不断地进行模型研发投资,每年至少要花费200亿美元。


研究开发芯片部分 在AI部分的R&D,每年的总投资至少是700亿美元。如果你想更快地进入,增加R&D投资是不可避免的。估计每年需要加大对AGI最终目标的R&D投资力度,达到1000亿美元。


上述R&D费用不包括培训费用,而且培训需要大量的水电能耗,这部分基础设施也需要自建。


根据IEA(国际能源协会)计算,欧美目前建设1KW核电机组的成本约为4000美元,每百万千瓦核电机组每年发电约8.6亿度电,全球人工智能将在2027年耗电1340亿度,因此建造155组百万千瓦的核能机组大约需要6000亿美元。


根据加州大学河滨分校的研究,2027年,人工智能将消耗66亿立方米的清洁淡水,约为英国用水量的一半。主要场景来自三个耗水阶段:服务器冷却、发电和芯片制造。建造相应的水处理厂的成本约为1000亿美元。


与之前的投资相比,制造环节的人工成本相对较小,主要集中在芯片设计上,包括模型研发部分。


前端晶圆厂充满了人力配置。 ,所有前端工厂(包括DRAM、中介层等)每万片大约需要1000人,后期大约需要15000人,GPU年产能2000万片大约需要2万人,人均年芯15万美元,后期包装需要3万人,人均年薪约7万美元,加上5000名各类芯片制造R&D人员,人均20万美元,每一年,芯片制造商的工资总额为60亿美元。


根据英伟达达的设计和大语言模型的人工成本, OpenAI 微软服务器单位计算1.5倍,约5万人,平均年薪30万美元,涉及服务器的硬件制造工厂总数为15万人,电力和用水保障设施人员15万人,总共30万人,平均年薪8万美元,总共240亿美元。


上述所有环节,人工薪酬费用为每年60亿 150亿 总共有450亿美元的240亿美元。


在材料成本方面,GPU及相关芯片,加上所有服务器硬件,每件2000美元,每年2000万美元,即400亿美元。在服务器运行成本方面,人工成本为420亿美元 材料成本400亿美元 其它杂费180亿美元,取整数1000亿美元。


OpenAI年产2000万个GPU的投资和各种费用计算,单位:美元


上述就是奥特曼亲自造芯所涉及的主要环节的费用拆解,如果为奥特曼花这笔钱,理想的解决办法是:2000亿美元建设年产2000万个GPU(2024年全球约1000万个),以及所有服务器硬件的制造工厂,然后每年投入1000亿美元推动AGI的最终目标,相关设计、R&D、制造总人工成本1000亿美元,建设能源和用水基础设施投资7000亿美元,同时编制2000亿美元现金用于应对税费和各种杂费或未计算的费用,最终保留4000亿美元作为可能漏算的准备金。因此,覆盖2000万个AI大约需要1.7亿美元。 所有GPU制造厂的风险投资。


在运营资金方面,需要保持每年1000亿美元的芯片和硬件新产能投入,继续推进摩尔定律,提高晶体管密度。每年新增2000亿美元的新电力和新用水投入,以及每年约1000亿美元的人工和材料。在这种情况下,每年的极限是增加7000亿美元的运营成本。


因此,不到2亿美元可以覆盖2024年全球AI芯片需求两倍的所有相关制造、能源基础设施和运营费用。,每年增加7000亿美元,这个预算大致可以再烧7.5年。


在拥有全球AIGPU两倍产能的基础上,奥特曼无法垄断全球人工智能-OpenAI模型,建立了以台积电为代表的全球最先进的芯片制造,并建立了以英伟达为代表的GPUic设计,假如奥特曼另起炉灶,全方位生产AI芯片,几乎会激怒全球芯片公司。


台积电、英伟达和许多芯片设计公司作为“老势力”,可能会帮助OpenAI的所有竞争对手,包括硅谷甚至全球大大小小的大型模型和AI应用公司,比如老对手DeepMind加谷歌,AWS,像Mircosoft这样的巨人,Stability、Anthropic等OpenAI创始人设立的企业。


即使OpenAI的芯片设计和制造能力与台积电和英伟达相当,面对世界上所有大小模型和算法的公司,也未必有很大的优势,更不用说用7万亿元的结局制造芯片,站在英伟达和台积电的对立面。


客观来说,如果不考虑生态,GPU设计公司就没那么不可替代了。在GPU设计中,没有AMD,甚至Cerebras,一家AI芯片设计公司,设计了整个晶圆面积,远远超过了传统的GPU。然而,在芯片制造方面,台积电目前倾向于骑行。


以2024年为例,台积电可以生产N3P工艺,每平方毫米高达2.84亿晶体管密度,排名第二的英特尔只能生产每平方毫米1.8亿晶体管的Intel。 第四,第一和第二之间已经出现了现代差异,如果在最高性能的芯片上不使用台积电技术,就会落后于竞争对手一代又一代。


芯片制造不能花钱积累,更需要技术积累的行业。最早需要三年时间才能建成芯片工厂,制造芯片。,对于OpenAI来说,假设“7万亿”真实存在,面对“旧势力”的反击,至少要持续三年。


本文来自微信微信官方账号“腾讯科技”(ID:qqtech),作者:LeslieWu,36氪经授权发布。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com