标签:凶残 - 华人论坛

维修经验

显卡超级凶残的volta tensor core性能

混合精度矩阵乘法: tensor core vs. fma: 对于cublas与cudnn来说只用设置math_op到CUDNN_TENSOR_OP_MATH,完全透明。 可参考这个帖子: https://www.chiphell.com/thread-1761759-1-1.html 评论 这个对比好厉害...华人论坛