手机浏览器扫描二维码访问
n
至于其他几项核心参数,骄阳300的表现也同样出色。
基于全新的混合架构,骄阳300的数据传输延迟,从前代的15ns,进一步压缩至10ns!
内存带宽也从前代的1tbs,提升至1.5tbs!
与之相比,英伟达teslak40,内存带宽仅有288gbs,且延迟高达200ns。
以模型训练为例。
同等任务下,如res-50模型100轮迭代,前者的计算效率,是后者的5.2倍!
此外,基于骄阳架构,针对“ai高频算子优化”的硬件加速模块,骄阳300的自注意力计算能力,从前代的2.1万亿次秒,提升至3.0万亿次秒!
而teslak40,仅有0.