第594章 性能碾压CUDA? (第2/2页)
德里克盯着面前的显示器,双手离开键盘,重重地搓了搓脸颊。
他是CUDA生态核心开发团队的资深工程师,平时自诩为硅谷的“肝帝”。
但此时此刻,他觉得自己引以为傲的肝,大概是需要报废了。
“亚瑟,你确定硬件没插错吗?”德里克转头,看着旁边顶着两个黑眼圈的助理工程师。
亚瑟打了个大大的哈欠,抓起桌上的功能饮料灌了一口。
“老大,这已经是你今晚第八次问我这个问题了。”
亚瑟指了指玻璃机房里那台全速运转的测试机。
“里面插着四张AMD的顶级显卡,主板是全新的,连供电线都是我亲手接的。”
德里克咬着牙,指着屏幕上正在跑的代码终端。
“那你能给我解释一下,为什么这套叫‘九章’的玩意儿,跑我们的矩阵乘法测试用例,速度比咱们自家的卡配合CUDA还要快百分之十二?”
亚瑟摊了摊手,脸上写满了“我也很绝望”。
“不仅是矩阵乘法,刚才跑的快速傅里叶变换,它领先了百分之十五。”
德里克猛地站起身,绕着工位走了两圈,伸手抓了抓本就稀疏的头发。
“这完全不讲基本法啊!AMD的硬件架构什么德行我们最清楚。”
“他们那套驱动烂得连他们自己人都头疼,怎么可能榨出这种级别的算力?”
亚瑟滑动鼠标,将一份底层调度日志拖到主屏幕上。
“老大,问题就出在这儿。九章根本没用AMD的官方驱动逻辑。”
“他们估计重写了底层,直接绕过了那些臃肿的冗余代码,直接对显存和流处理器进行微操。”
德里克凑近屏幕,盯着那些跳动的十六进制地址和调度线程。
一行行看下去,他的呼吸越来越重。
这代码写得太妖孽了。
没有任何多余的指令,每一级缓存的命中率被计算到了极致。
这种感觉,就像是有人开着一辆破旧的二手皮卡,在赛道上套了他们F1赛车的圈。
关键是,对方的车技毫无破绽。
“这帮中国人是怪物吗?”德里克跌坐回椅子上,感觉血压直线飙升。
“盛夏科技……我连听都没听过这家公司,他们哪来这么多懂底层硬件的神仙?”
亚瑟摇摇头,敲击键盘调出另一份数据。
“也并非全方位碾压,我们加班加点测了三十四个核心模块,还是赢了两项的。”
德里克眼睛一亮,仿佛抓住了救命稻草。
“哪两项?快说!”
“一个是针对早期单精度浮点运算的某个特定物理引擎的兼容性测试。”
亚瑟看着屏幕,语气毫无波澜。
“还有一个是极少数非标格式的视频解码渲染。”
德里克刚刚燃起的希望瞬间熄灭。
“这有个屁用!这都是边缘得不能再边缘的功能,下个版本我们自己都要弃用的东西!”
亚瑟叹了口气,点击鼠标,将一份文档拖了出来。
“老大,还有一个更让人破防的消息,你要不要听?”
德里克按住胸口,深吸了一口气。
“说吧,我的心脏承受得住。”
亚瑟将文档全屏,指着上面一段英文翻译。
“这是九章计算平台官网的开发者文档说明。”
“上面写着:当前版本仅为单节点预览版。”