英伟达:一个万亿级故事的启发
有一家公司的传奇故事,在美国硅谷的创新风暴中,足以让每一个创业梦想家心潮澎湃——那就是英伟达。
一九九三年,美国加州圣何塞丹尼餐馆(Denny's)里,黄仁勋和他的两个朋友,克里斯·马拉考斯基斯基斯。(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)英伟达共同创立。选择这家餐馆,老黄说:“因为这里比家里安静,而且有便宜的咖啡”。三人凑在一起,想用3D图像技术闯出一片天空。此时,市场上还没有3D图像处理的标准,技术路线多种多样。
英伟达的历程就像硅谷版的《暴发户史》,从一个小型创业企业到一个市值超过3万亿美元的科技巨头。它不仅在人工智能、自然语言理解、边缘计算等领域翻开了新的篇章,也在科技历史上留下了深刻的印记。此时此刻,它也在撰写商业和科技传奇。
黄仁勋在创业阶段
事实上,在nvdia成立之初,30岁的黄仁勋也不知道该怎么走。用他自己的话说:“坦率地说,我不知道该怎么办,他们也不知道。每个人都不知道该怎么办。”
英伟达NV190年代小试牛刀,NV2研发失败
在20世纪90年代初,计算机用户仍然对2D图像和简单动画感到兴奋,玩家们渴望提高游戏性能。高速发展的 PC 游戏产业,真正开始让人们开始关注。 3D 未来图形的重要性。但是,当时的显卡技术并不能满足动画场景日益复杂的需要。三位英伟达创始人黄仁勋,Chris Malachowsky和Curtis Priem,对这个市场空白的洞察,他们决定创建一个能够处理复杂3D图像处理的产品,以满足游戏玩家的愿望。因此,NVIDIA基于NV1。 STG-1995年9月30日,2000X发布,是英伟达首款真正意义上的显卡产品。NV1锁定了图像处理需求的主要客户——游戏制造商,集图像处理、声卡和游戏手柄接口功能于一体,被认为是当时市场上比较先进的产品。NV1不仅硬件规格完善,而且引入了硬件加速的3D图像处理能力,使得游戏画面的流畅性和真实性有了质的飞跃,概念超前。那时,这是一次大胆的尝试,因为3D图像处理技术在PC领域还处于起步阶段,很多人都在质疑这种创新能否被市场所接受。
NV11第一代芯片NVIDIA
NV1的集成方案吸引了日本世嘉,一家正在与任天堂掰手腕的游戏机制造商,英伟达帮助世嘉完成了3D游戏《VR战士》和《铁甲飞龙》的PC移植。游戏机不需要考虑兼容性,所以英伟达作为一个只有制造商,正好满足了世嘉的需求。双方一拍即合,世嘉豪花700万美元资助英伟达研发下一代NV2。、用来让自己的下一代主机——Dreamcas。
今年,微软收购了RenderMorphics公司(Reality) Lab实验室专门研究3D图形技术和API技术),并在后续开发了Windows。 Direct95 3D标准,并逐步演变为PC游戏的事实标准。对于英伟达来说,这并非一个好消息。Direct 基于三角纹理的3D贴图,而英伟达的NV1却无法与之匹配,但是微软的江湖统治让英伟达深知Direct。 3D将成为主流技术。也就是说,这将迫使英伟达重新思考如何应对即将发生变化的PC市场。即使NV1在兼容性方面遇到了一些挑战,但是它带来的视觉震撼,让人们记住了来自英伟达的惊喜。
此时,英伟达犯了一个错误:团队坚持使用方形制图(主流技术是三角制图渲染),直接导致NV2R&D失败,Dreamcast难以生产。黄仁勋直言,当时英伟达的架构策略与主流3D图形技术的趋势大相径庭。除了无法适应Windows,实际游戏表现也很一般。如果你想完成合同,你必须从一开始就开发一个图形处理器,如果你不履行合同,700万美元的资金会瞬间成为这家30人小公司的负债。这时,英伟达离破产只有一步之遥。
NV2的失败使英伟达陷入了严重的财务困境,公司的未来一度变得复杂。老黄选择飞往日本,与世嘉见面。由于自己的错误,他坦率地说,芯片已经不需要继续研发了,但是仍然希望对方能够按照合同支付。也许是老黄的真诚打动了世嘉,世嘉选择原谅和包容,继续付出,英伟达能够挺过难关。他说:“正是我们正视错误,及时止损,谦虚地寻求帮助,才挺过了破产的困境。”黄仁勋回忆道。OpenGL API 和 Direct3D是当年3D图形开发领域的两大主流。 API。随后,OpenGL计算机图形管道帮助英伟达杀出重围。用老黄对同事们的话说:“伙计们,我找到了我们的未来!”
企业参与市场竞争,从来没有一帆风顺。
一九九五年十一月六日,人类历史上最伟大的显卡Voodoo问世,与英伟达也爆发了不少火花。据报道,Voodoo在鼎盛时期曾占据3D加速卡市场份额的85%,是全球市场份额最高的3D芯片。由科技创业公司3dfx推出的Voodoo,在短短几年内迅速占领市场,并迅速从人们的视线中消失(Nvidia于2000年12月15日正式收购3DFX,成为图形芯片大战的最终胜利者)。
Direct3D于1996年被微软集成到操作系统Windows中。 95 在OSR2中,此时,《雷神之锤》引发了3D显卡革命。今年,市场上出现了第一批具有3D功能的显卡,当时包括S3公司在内的ViRGE显卡在国内比较常见, ViRGE 一经推出,就被宣传为“世界上第一个集成。 3D 虽然它在图形加速器中, 2D效果很好,但是现在 3D 方面却不好透顶。
竞争百花争艳,时代悄然而至。
一九九七年,英伟达乘势推出第三代商品Riva128,这是第一款支持微软Direct3D图形接口的高性能128位图形芯片,得到了微软的大力支持。凭借远超竞争产品4倍的性能赢得市场青睐,四个月狂销100万片,英伟达涅盘重生!
而且很少有人知道,在Riva128出现之前,英伟达的所有资金只能维持一个月的工资支出。
但是在GPU的制造中,有着精致复杂的 RIVA 英伟达在128的坎坷道路上寻求台积电的支持。台积电的奠基人张忠谋,在阅读了黄仁勋的亲笔信后,亲自打了电话。接电话的黄仁勋与张忠谋达成了默契:英伟达可以全心全意地专注于芯片设计,生产事宜可以放心地交给台积电。随后,包括台积电、华硕和技嘉在内的行业领军人物,帮助英伟达登上全球显卡速度之巅。TNT具有强大的性能。、TNT2相继推出,竞争对手纷纷被挑落马下,英伟达最终在芯片市场站稳了脚跟。
英伟达创造了世界上第一个GPU
上世纪90年代初,市场上的显卡只有2D功能,而3D则完全由CPU计算。
英伟达于1999年8月31日推出GeForce 256显卡,在介绍中,GeForce 256被称为“世界上第一个GPU”。包括戴尔,Gateway、康柏和NEC、IBM等都宣布将预装英伟达的GPU,而多家头部显卡制造商也纷纷反戈,明确表示将加入英伟达阵营。
此时此刻,英伟达只是想为玩家打造最好的3D图形芯片,并没有意识到自己已经拿到了通往巅峰的钥匙。GPU的并行计算能力在游戏《雷神之锤》中赋予了玩家在速度上的优势,使得英伟达GeForce显卡成为游戏玩家的首选,GeForce 每次出新产品都会有玩家跟上。GeForce 256就像一剂强心针,不仅让英伟达在游戏显卡市场一炮而红,也为其在GPU图形加速领域的王者地位奠定了基础。GeForce 256不仅是技术的升级,也是对市场策略的准确把握。它以贴近百姓的价格、出色的性能和对DirectX的无缝支持赢得了玩家的热烈欢迎。
一九九九年,英伟达在纳斯达克成功上市,IPO价格为每股12美元,股价迅速飙升,销售额达到1997年的440%,员工增加到270人,成为硅谷新秀。
伴随着GeForce系列的不断迭代,英伟达的GPU逐渐变得越来越强大,每一个新产品的发布都像是一场游戏盛会,让玩家们翘首以待。从GeForce开始 3先进的纹路技术和可编程的顶点着色器,到GeForce 四是多线程处理能力,英伟达的GPU逐渐成为游戏开发者心中的黄金标准。他们使游戏画面更加生动,特效更加真实,游戏体验也随之提升到了一个全新的水平。
在一定程度上,多年来,人们几乎接受了英伟达被一家全球玩家支持的科技公司的事实。游戏圈一直流行这样一句话:选择N卡是一种信仰。

RTX显卡新款NVIDIA
黄仁勋还提出了一个“黄氏定律”,即“英伟达的核心战略是产品每六个月升级一次,功能翻倍。”这比1965年提出的摩尔定律(英特尔“摩尔定律”更重要。:每隔18个月,芯片上可容纳的晶体管数量翻了一番,性能翻了一番)还要快三倍!
英伟达并未止步于此,它继续深化与游戏开发者的合作,将GPU技术与游戏引擎紧密结合,共同推动游戏产业的发展。例如,英伟达的PhysX物理加速了技术,使游戏中的物体运动更加真实,增强了游戏的沉浸感。此外,英伟达还推出了G-SYNC技术,解决了显示器刷新率与GPU导出帧率不匹配的问题,大大减少了画面撕裂和卡屏,带来了更加流畅的游戏体验。
在这个过程中,ATI(后来被AMD收购)等英伟达的竞争对手也在努力追求,但英伟达一直保持着领先水平和市场影响力的多重优势。通过不断创新,不断推出包括费米在内的新GPU架构(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)、伏特(Volt)、图灵(Turing)、安培(Ampere)和赫柏(Hopper)和布莱克韦尔(Blackwell)架构。经过15年的架构发展,正如英伟达官方所说:“人工智能计算领域的领导者推动了AI。、HPC、在游戏、创意设计、无人驾驶汽车和机器人开发方面取得了进步。“每一种结构都带来了革命性的性能提升和新的特点,巩固了它在PC市场的主导地位。
而且老黄并没有停下来。黄仁勋于2024年6月2日在台湾省大学综合体育馆发表主题演讲,提出了一张新的结构路线图:2025年是Blackwelll。 Ultra,Rubin将于2026年举行,Rubin将于2027年举行。 Ultra。
老黄找到了“自己的世界”
技术成就,来自于一贯的创新追求。GPU也是如此,CUDA也是如此。
GPU,这个神奇的工具,就像魔术师的手一样,构建了一个三维模型,赋予了屏幕上每一个像素活力。这背后是无数简单指令的并行计算,图形芯片的性能随着微控制器数量的增加而提高。英伟达一直渴望探索如何最大限度地发挥这些微控制器的并行计算潜力。这也是CUDA诞生的原因。
CUDA从何而来?使命是什么?
2000年,斯坦福大学生Ian Buck(现任英伟达副总裁)就像每个热衷于技术探索和DIY的男人一样, 32 个英伟达 GeForce 显卡连接在一起,外加 8 一台投影仪来玩《雷神之锤》,自己造了一台超清游戏机。这个超大型游戏机不仅展示了科技的力量,而且GeForce显卡在游戏领域的成功也奠定了新的坚实基础。Buck在实践中成功地破解了显卡的原始编程工具“着色器”(shader)”,利用其强大的并行计算能力,将GeForce显卡转化为一台低成本的超级计算机。
Ian Buck不是英伟达的员工,而是一个独立的开发者。他对GPU的底层结构感兴趣。英伟达的GPU指令集通过逆向工程成功解密,创建了一个简单的编译器,允许程序员直接从GPU上编写代码并行计算。事实上,这种突破性的发现,为CUDA编程模型和GPU计算的广泛应用奠定了基础。起初,英伟达对此持保守态度,甚至有人担心这种非官方的突破会对他的商品产生不利影响。然而,随着并行计算在科学研究、工程计算和图形渲染等领域的惊人表现,英伟达意识到这是一个巨大的机会。
在电影《第一个字D》中,夏树对拓海说:“我记得有人曾经告诉我,人最重要的是找到自己的世界。只要他们找到自己的世界,生活就会有意义。”
在发现GPU在超级计算领域的潜力时,我想那一刻,老黄应该找到了自己的世界。
老黄力邀Ian 加入Buck,共同构建软件,让每一个GeForce显卡都能显示出超级计算机的威力。与此同时,他督促硬件团队创新芯片架构,以满足更广泛的应用场景。到2006年底,黄仁勋向软件开发者打开了GPU的大门,发布了CUDA平台,赋予用户强大的计算能力,探索非图形领域,即用户可以将英伟达提供的计算率应用到图形之外的目的。
CUDA的推出,意味着GPU不再仅仅是一个图形处理器,而是一个通用的计算平台。这种变化极大地促进了高性能计算、人工智能、机器学习等领域的发展。这一决定不仅巩固了英伟达在GPU市场的领先地位,而且引领了整个科技产业对并行计算的广泛应用。例如,CUDA在物理模拟、生物信息分析、天气预报等领域发挥了关键作用。即使在电影特效制作中,GPU的并行处理能力也大大提高了视觉效果的渲染速度。
英伟达的战略更长远:不仅销售芯片,而且编织软件的基石。开放式CUDA平台!也就是说,无论是学生还是科学家,只要一个配置GPU的笔记本,就可以进行创新。最初几年,CUDA的投资回报并不平衡,黄仁勋的坚持一度受到股东的质疑。然而,开发人员逐渐发现,GPU在处理现代人工智能系统的复杂计算时,尤其是在处理大量同步任务时,远远超过了传统的CPU。黄仁勋对此深感惊讶。2016年接受《福布斯》深度采访时,他承认自己曾经预见过GPU在游戏之外的应用,但并没有预料到深度学习领域的辉煌。他有着敏锐的商业直觉,开始在公共场合频繁强调AI的重要性,积极倡导,成为人工智能的坚定倡导者。

NVIDIA数据中心解决方案
英伟达的CUDA生态系统在AI研发中尤为重要。该平台提供了TensorRT等大量的开发工具、库和框架。、CuDNN和NCCL,AI应用的发展过程大大简化,吸引了全球数以万计的开发者参与其中。通过CUDA,研究人员和工程师可以更有效地利用GPU练习和优化深度学习模型,从而促进AI领域的快速发展。AI领域的领先地位并非一蹴而就,而是源于英伟达的持续投资和创新。例如,A100和H100 GPU采用先进的Hopper架构,专为大型AI计算而设计,具有较高的计算密度和较低的功耗。这类创新产品不仅提高了AI性能,而且为数据中心的能效比带来了革命性的提高。
英伟达于2009年推出CUDA 2.0版本正式将GPU推向高性能计算领域,特别是AI计算领域。对于大量的数据处理和模型训练来说,GPU的并行计算能力尤为重要,这使得英伟达的GPU成为深度学习的首选硬件。举例来说,没有英伟达GPU的大力支持,谷歌的AlphaGo就无法战胜世界围棋冠军李世石。
从数据中心到无人驾驶汽车,从医学影像分析到虚拟现实,英伟达的GPU在AI计算中得到了广泛的应用,几乎涵盖了所有需要大规模计算的AI应用。例如,该公司推出的Tesla系列高性能计算卡,专门为数据中心设计,为AI模型训练和推理提供了强大的计算能力。在自动驾驶领域,英伟达的Drivee PX系列平台为车辆提供了实时的感知、理解和管理能力。

马斯克:2024年最多花费40亿美元购买英伟达芯片产品
到目前为止,GPU在AI模型训练中几乎是不可替代的,成为开发者的首选工具。英伟达的GPU和CUDA编程语言是建立AI应用的基石,从学术界、开源社区、开发工具供应商到公司R&D人员。每一项新兴的AI技术和工具,都以英伟达GPU的训练成果和CUDA编程后的实施性能为评价指标,推动人工智能不断迭代和创新。
而且CUDA,已经成为NVIDIA技术的“环城河”。
崛起不是偶然的。背后是英伟达对技术的完美探索,对未来的敏锐洞察,敢于突破的气魄,黄仁勋的不懈追求。就像采访中老黄最初的自我报告一样:没有法术,只有过去61年每天的辛勤付出。
回首过去,Ian Buck的破解让全世界的开发者重新审视GPU的作用,英伟达随后的CUDA开放策略将并行计算推向了顶峰。这一事件向我们证明,有时候,一个小小的创新火花可以点燃整个行业的变革之火。创业公司和巨头都应该从中汲取灵感,敢于创新,敢于挑战。
那是一个重要的启发!

黄仁勋喜欢穿皮衣
本文来自微信微信官方账号“万点研究”(ID:Agumanhua),作者:渔民,36氪经授权发布。
本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。
免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com




