行情频道: 行情 / 知识 / 新股 / 要闻 / 基金 /

AMD推出MI300X GPU,性能超过H100,可支持更大的模型训练和推理

AMD推出了旗舰数据中心AI芯片AMD Instinct MI300X GPU,由8个CDNA组成 Accelerator3架构 Complex Die(XCD)、4个I/O Die(IOD)、共有12个5nm由8个HBM内存堆栈组成 集成系统的Chiplet,计算核数、带宽和内容容量显著增加;MI300X最终拥有1530亿颗晶体管和192GB HBM3内存容量5.3TB/s峰值内存带宽,896GB/s Infinity Fabric互连带宽,FP16/FP8计算能力为H100的1.3倍,显存2.4倍,显存带宽1.6倍,它可以支持更大模型的训练和推理,而定价可能更具成本效益。

AMD修复市场规模增长预期,明年出货指南乐观

AMD将在未来四年将数据中心加速器市场规模的CAGR从40%修复到70%,即预计将从2023年的300亿美元增加到2027年的4000多亿美元;与此同时,AMD预计MI300X系列将在2024年出货约30万-40万,最大客户是微软和谷歌。如果没有受限台积电CowoS产能短缺,英伟达已经预订了4个以上的产能,这一系列的发货可能会再次修复。

ROCm 6.微软、Meta等巨头将率先购买生成式人工智能优化

ROCm 6开放软件平台优化了新数据类型、先进图形和核心,增加了生成人工智能的Flash Attention、HIP Graph、VLLM等关键功能支持,Llama 2 单个MI300X在13B推理任务中的性能是H100的1.2倍;微软,Meta、OpenAI、Oracle等公司已率先承诺将购买AMD的GPU取代H100,目前AMD已向HPEE转移、原始设备制造商如戴尔、联想、SuperMicro等发货,正式发货时间定于下季度。

海光深算DCU与ROCM生态兼容,有望通过兼容性和性价比提高AI芯片的市场份额

根据海光,深度计算DCU与ROCM生态完全兼容,由于ROCM和CUDA在生态和编程环境方面的高度相似性,CUDA用户可以以低成本快速迁移到ROCM平台;深度计算2实现了大数据处理、人工智能、商业计算等领域的商业应用,具有全精度浮点数据和各种常见的整形数据计算能力,与深算1号相比,性能提高了100%,深算3号研发进展顺利。我们预计,未来海光深算系列芯片有望通过兼容性和性价比提高人工智能芯片的市场份额。

中科曙光是海光信息的最大股东,支持配备深算芯片的高密度GPU服务器

中科曙光是中国核心信息基础设施的龙头企业,在高性能计算、存储、安全、数据中心等领域拥有深厚的技术积累和领先的市场份额。根据公司23年中期报告,公司持有海光信息27.96%的股份,是其最大股东。同时,公司推出了基于海光DCU的X875系列服务器,支持多达8个培训GPU,为高密度GPU计算提供全方位性能支持。深算系列GPU市场份额提升进程有望深受益。

相关标的

(1)国产AI芯片:海光信息、寒武纪、景嘉微、龙芯中科;

(2)国产服务器:中科曙光、浪潮信息、高新技术发展、神州数码、中国长城、拓息、烽火通信、软通电力、四川长虹、紫光等。

风险提示

人工智能大模型相关技术进展低于预期,相关政策推广低于预期,国际形势变化超出预期,研发进展低于预期,芯片供应不足影响市场推广风险[浙江计算机]

相关阅读

本文AMD推出MI300X GPU,性能超过H100,可支持更大由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们! 分享到: 新浪微博 微信

扫描左侧二维码
看手机移动端,随时随地看 股票 新闻