1深度学习超算:170T浮点

文章正文
发布时间:2024-09-03 14:09

从今年的GTC大会上可以看到,NVIDIA花了更多的精力和时间在企业级产品之上,包括万众期待的Pascal显卡,无论是1月份首发的Drive PX 2自动驾驶平台,还是这次的Tesla P100 HPC计算卡。

Tesla P100这次的独特指出在于拥有14MB的Register File以及4MB的二级缓存,当然它也不是样子货,除了IBM、惠普、戴尔等将在明年推出终端产品,NV自己也发布了DGX-1,这是一款用于主打深度学习的超算。

DGX-1搭载两颗Xeon处理器、8张Tesla P100显卡和7TB SSD,万兆网口、功耗3200W,售价达到了惊人的12900美元(约合83000元人民币)。

因为半精度浮点运算高达170TFLOPS,NV称,相当于250个纯x86的传统服务器。

至于实际的应用体验,同样的运算任务,去年GTC上4个Maxwell GPU用时25小时,现在,8颗Pascal只需2小时。

PS:AlphaGo高配用了数千颗CPU和数百颗GPU,今后有了DGX-1,其体积将会进一步缩小,而能力则会大大提升。■