【365买球app】7nmVega20香归香,但AMD需要的除了新制程,更重要的是新架构

本文摘要:INT8和INT4等对于机器学习推理小说特别简单的低精度数据类型,INT8的性能是FP16的性能的2倍,是58.9Tops,INT4的性能是FP16的性能的4倍,超过了118Tops。

INT8和INT4等对于机器学习推理小说特别简单的低精度数据类型,INT8的性能是FP16的性能的2倍,是58.9Tops,INT4的性能是FP16的性能的4倍,超过了118Tops。但是,从AMD的展示来看,这些新的数据类型的灵活性和可用的命令还不清楚,解读新的GPU的所有功能是最重要的。AMD还加强了Vega20的RAM系统,为GPU减少了另一个HBM2RAM控制器,RAM宽度完全恢复到Fiji时代的4096bit,同时RAM频率也提高到了2Gbps,GPU的RAM比特率超过了1TB/s同时,由于这是专注于企业的GPU,从终端获得ECC检验能力和可靠性、采访性和维护性(RAS)技术对大规模HPC计算结果的正确性至关重要,AMD级GPU数年来首次获得原始ECC反对。

此外,Vega20还反对AMDMxGPU技术,是业界唯一基于硬件的GPU虚拟化解决方案,基于业界标准的SR-IOV(单个I/O虚拟化)技术,黑客无法展开硬件水平的反击,有助于虚拟化云的配置获得安全性。在PCI-E通道中,AMD已经泄露了Vega20反对最近的PCI-E4.0标准,在同样的x16配备下比特率哈密顿PCI-E步骤的3.0倍,超过了32GB/s。此外,AMD还为Vega20设计了一对片外InfinityFabric链接,允许Radeoninstinct卡通过相关链接,每个链接都是100GB/s的全双工比特率。

值得注意的是,每个GPU只有两个链接,因此AMD的流形选项仅限于环上的变化,路配备的GPU不能全部相互通信。此外,AMD仍然坚决用于PCI-E显示卡的形式,不像NVIDIA那样定制夹层卡,因此这些卡必须通过顶部桥接器连接。由于7nm技术,Vega20构筑了132亿2千万晶体管,比现在Vega10的125亿晶体管减少了6.4%,但面积只有331mm,比Vega10的484mm小得多。

MI60和MI50的TDP都是300瓦,同等消耗电力的性能提高了25%,同等频率的消耗电力减少了50%,但AMD对新的计算卡的确实威力在于新的功能,而不是与现有的MI25计算卡竞争传统的FP16/FP32的计算力。传统式的GPU架构允许人们处置和剖析当代云数据中心大变样的极大数据集市场需求。AMDRadeon技术集团工程高级副社长DavidWang说:AMD新RadeonInstinct加速卡融合了世界一流的性能和灵活性,因为业界领先的开放软件生态系统ROCm有助于解决问题AMD全部发表了加快计算的新ROCm、2.0对外开放软件平台,为大规模集团设计,允许用户在对外开放环境中配置高性能、低能效的异构计算系统。除了反对新的Radeon外,Instinct加速器和AMDInfinityFabricLinkGPU点对点技术外,还为新的DLOPS获得了改版的数学库,反对CentOS、RHEL和Ubuntu等64位Linux操作系统,反对TensorFlow1.11和PyTorch(Caffe2)等最受欢迎的深度自学框最近的版本。

谷歌TensorFlow工程负责人RajatMonga说:谷歌相信开源对每个人都有好处,我们已经看到开源机械学习技术有多合作,很高兴看到AMD拒绝接受。通过ROCm对外开放软件平台,TensorFlow用户将获得GPU加速和更强大的开源机械学习生态系统。回忆起迄今为止的Vega10,与上一代Fiji结构相同的4096流处理器时,RAM从4096bit提倡斧头下降到2048bit,晶体管的数量从89亿减少到125亿,但对应的游戏显示卡Vega64实际上只有72亿晶体管的GP104核心(GTX1080)AMD本次发表的Vega20仍然维持着4096流处理器的规模,但是XIII首次显示了半速双精度、INT8、INT4、ECC等HPC加速卡所需要的重要因素,Vega20方是Vega结构的确实形态。

但是,AMD必须明确认识到,与在CPU领域与Intel的竞争相同,NVIDIA的领导能力结构和指令集等方面具有优势。近两年来,AMD在性能、消耗电力、面积三方面依然无法考虑,多年来处于放弃其多次田忌赛马的状况,Vega20获得的转型成绩几乎不吃的是7nm工艺的红利。从目前展出的数据来看,Vega20的性能比Vega10提高了约20%,与NVIDIA的上一代16nm、120亿晶体管的GP102核心(1080Ti)相比,300瓦的TDP也相对较低相反,NVIDIA在2014年半导体工艺被困在28nm节点时,AMD的GPU停止,NVIDIA取得了可以说是白色技术的新型Maxwell结构。

晶体管的数量从71亿减少到52亿,流处理器从2880个增加到2048个,TDP从250瓦减少到165瓦时,GM204核心GTX980的性能还不及上一代Kelper结构GK110核心GTX780Ti在NVIDIA这么可怕的结构设计面前,AMD这样依赖工艺红利不仅仅是长期的计划,还和饮酒过度止渴一样。如果AMD继续保护旧的GCN结构修补,不开发低能效的新结构,NVIDIA也可以用于7nm技术,几乎可以像Intel一样重新开发AMD。原始文章允许禁止发布。

下一篇文章发表了注意事项。

本文关键词:365买球,365买球app,365买球官网

本文来源:365买球-www.flyingpigtechnologies.com

相关文章