在以往,用英伟达的CUDA写代码,繁琐。
程序员必须手动在主机的内存里开辟空间,再在显卡的显存里开辟空间。
然后要把数据从主机复制到显卡,接着手动设置线程块和网格的大小。
稍微设置不合理,显卡就直接罢工不干。
算完之后,还得再把数据从显卡慢吞吞地拷回主机。
但当楚一航按照TenSOrFlOW的文档指引敲击键盘时,他发现那些全都不需要了。
他只需要定义好数据格式,声明好网络层数,框架的底层执行引擎会自动接管所有的硬件资源调度。
不到二十行代码。
简洁,优雅。
“这就写完了?”楚一航自己都不敢相信。
“这几十行代码,放以前用C语言加CUDA手搓,至少得写大半天,还得调试一整天。”
The content is not finished, continue reading on the next page