这完美契合了AI算法和推荐系统需要的大规模并行计算。
可是,硬件再强,也需要软件驱动。
在CUDA出现前,程序员想用显卡算力做非图形渲染的通用计算,简直是噩梦。
他们必须把非图形数据,强行伪装成图形像素数据,通过复杂图形API通道传给显卡。
等显卡算完,还要把输出像素数据反向解析回通用数据。
这种操作极其繁琐,写错一行代码,就会导致程序崩溃。
所以,空有强大并行算力,却没人能轻易用在非游戏领域。
直到黄仁勋做出大胆决定,推出CUDA。
CUDA全称是计算统一设备架构。
它本质是一个软件开发平台和编程模型。
英伟达在每张显卡底层嵌入了CUDA硬件指令集,同时在软件层面推出一整套编译器、库文件和开发工具。
The content is not finished, continue reading on the next page