第566章 破局奇招(1 / 1)

要搞清楚CUDA是什么,先要明白CPU和GPU的区别。

CPU架构有复杂的控制单元和巨大缓存。

这种设计是为了处理复杂逻辑运算。这要求CPU必须有很强的单核性能。

但CPU物理核心数量有限,就算最高端的服务器CPU,面对海量简单计算时,也会因为线程数量限制而排队。

快看网的推荐算法,本质是海量矩阵乘法。

这些计算本身不复杂,不需要多强逻辑推理,但数量极其庞大。

让CPU去算矩阵,是高射炮打蚊子,效率极低,而且容易把服务器撑爆。

GPU架构完全不同。

GPU没有复杂控制单元,内部塞满了成百上千个简单的流处理器。

这些流处理器只能做基础运算。

但因为数量庞大,它们可以同时并行处理海量数据。

这完美契合了AI算法和推荐系统需要的大规模并行计算。

可是,硬件再强,也需要软件驱动。

在CUDA出现前,程序员想用显卡算力做非图形渲染的通用计算,简直是噩梦。

他们必须把非图形数据,强行伪装成图形像素数据,通过复杂图形API通道传给显卡。

等显卡算完,还要把输出像素数据反向解析回通用数据。

这种操作极其繁琐,写错一行代码,就会导致程序崩溃。

所以,空有强大并行算力,却没人能轻易用在非游戏领域。

直到黄仁勋做出大胆决定,推出CUDA。

CUDA全称是计算统一设备架构。

它本质是一个软件开发平台和编程模型。

英伟达在每张显卡底层嵌入了CUDA硬件指令集,同时在软件层面推出一整套编译器、库文件和开发工具。

CUDA最伟大也最可怕的地方在于,它允许程序员直接用最普及的C语言,调用显卡底层算力。

程序员不再需要学晦涩的图形API,也不需要伪装数据。

只要会写C语言,只要装了CUDA开发包,就能轻松把一段并行计算代码跑在英伟达显卡上。

这极大降低了GPU通用计算门槛。

华尔街投资人不理解,为什么一家卖硬件的公司,要养几千软件工程师维护一个免费给开发者用的平台。

但黄仁勋顶住压力,强行推广CUDA。

他甚至跑到各大学计算机系,免费发支持CUDA的显卡,鼓励学生用CUDA做科研计算。

这是一个极度长远的阳谋。

随时间推移,越来越多程序员习惯用CUDA。

各种基于CUDA的科学计算库、深度学习框架开始在开源社区生长。

当2025年大模型时代爆发,全球科技公司都需要海量算力训练AI时,他们发现一个绝望的现实。

所有成熟AI算法,所有好用的深度学习框架,底层代码都是基于CUDA写的。

而CUDA,是英伟达的私有闭源技术。

它只支持英伟达自家显卡。

如果买一批AMD显卡,会发现根本无法运行主流AI算法,因为AMD硬件解析不了CUDA指令。

想在AMD显卡上跑通大模型,必须把整个软件生态从底层重写。

这个工作量,大到没有公司愿意承担。

这就是为什么,到了AI时代,所有人都只能捏着鼻子去抢购英伟达高价算力卡。

算力可以制造,但生态一旦形成,就是一道叹息之墙。

夏冬放下手机,揉了揉眉心。

他现在处境很矛盾。

如果批准吴泽明的迁移方案,盛夏科技算力危机立刻就能解决。

凭借CUDA的并行计算能力,快看网推荐算法效率至少提升数十倍,服务器压力彻底释放。

但这等于替英伟达测试他们还不成熟的早期生态。

盛夏科技作为国内目前数据量最大、算法最先进的互联网公司,一旦全面拥抱CUDA,在这个平台跑通所有推荐逻辑。

那就会形成路径依赖。

盛夏科技的程序员会越来越习惯调用CUDA函数库。

等几年后,陆奇和国内团队把盛夏科技自己的通用GPU流片成功。

夏冬总不能指望自家硬件去支持对手的私有协议。

到那时,盛夏科技自己开发的GPU,会面临完全没有软件可跑的尴尬。

要让手下这批习惯了CUDA的程序员,重新学一套新指令集,把快看网庞大的底层代码全部重写。

那将是一场灾难。

时间成本和试错成本,都会拖垮整个公司。

夏冬在办公室里踱步。

不能因噎废食,服务器必须救,现阶段只有英伟达显卡加CUDA能解决燃眉之急。

但这口毒奶,不能毫无防备地咽下去。

一旦底层的代码全部基于CUDA编写,盛夏科技的整个软件生态就会被牢牢绑死在英伟达的战车上。

将来盛夏科技自己研发的通用GPU造出来了,难道还要去恳求老黄开放接口授权吗?

老黄绝对不会同意。

到时候自己花上百亿造出来的芯片,就会变成一堆没有软件适配的废硅片。

重写底层代码?

这个体量的代码重构,必定是个大工程,伤筋动骨。

夏冬站起身,在宽敞的办公室里来回踱步。

他陷入了一个思维的死胡同。

硬件打不过,软件又被绑定。

似乎是个无解的死局。

突然,他的动作停住了。

一个极其大胆,甚至有些疯狂的想法,在他的脑海中成型。

他猛地拍了一下大腿。

暗骂自己愚蠢。

干嘛非要去跟老黄在底层硬件框架上死磕?

未来的假想敌英伟达,真正的护城河根本不是那块硅板,而是CUDA这个闭源软件生态。

全球的程序员都习惯了用CUDA写代码,这才是最可怕的路径依赖。

夏冬咧开嘴,思路瞬间全打开了。

既然CUDA是护城河,那自己就不需要在起步阶段死磕硬件。

打败魔法的最好方式,就是创造一种新的魔法。

他完全可以做一个跨平台的类似CUDA的底层框架。

把复杂的底层指令集全部封装起来,给程序员提供一套极其简单好用的高级API接口。

现阶段,这个框架的底层完美兼容英伟达的显卡,利用老黄的算力来培养自己的开发者生态。

等到几年后,盛夏科技自己的通用GPU流片成功。

开发者们根本不需要去学什么新指令集,也不用重写代码。

只需要在开发框架的后台,把运行环境从“英伟达”切换成“盛夏”就行了。

这样一来,英伟达现在卖给他的每一块显卡,都是在给盛夏科技未来的软件生态打工。