亚历克斯立刻转身面对伊利亚,开始在白板上列数据。
“表面上看是两码事,但实际上完美契合。你想想,我们现在的代码用CPU跑,为什么这么慢?”亚历克斯反问。
伊利亚思索了一下。
“因为要处理庞大的矩阵乘法运算,数据量太大了。”伊利亚如实回答。
亚历克斯重重地敲了敲白板。
“这就对了!CPU的核心数量很少,一般只有两到八个。它的架构设计是为了处理操作系统里复杂的逻辑分支。”亚历克斯开始分析。
接着,他在旁边写下英伟达显卡的参数。
“但你看GPU。它精简了复杂的控制逻辑,把芯片面积全留给了几百上千个小计算核心。”亚历克斯指着那些数字。
“深度神经网络的核心运算是什么?就是海量的加减乘除和取最大值。根本不需要复杂的逻辑跳转。”亚历克斯看着两人。
“让几个全能的CPU核心排队去处理上百万次简单的乘法运算,这完全是资源错配。”亚历克斯抛出核心论点。
“而GPU的几百个核心,可以把这上百万次乘法拆解开,同步进行并行计算。这才是真正的算力匹配!”亚历克斯提高了音量。
The content is not finished, continue reading on the next page