核心观点
英伟达的表现和指导都超出了预期,验证 ai 计算长期景气度。1)英伟达2024财年第四季度业绩超出预期,收入达到创纪录 221 亿美元,环比增长 同比增长22% 265%。其中,数据中心业务在 Nvidia Hopper GPU 计算平台和 InfiniBand 在端到端网络的推动下,2024财年第四季度收入达到184 1亿美元创历史新高,环比增长 同比增长27% 409%;同时,2024财年数据中心约 40% 人工智能推理的收入。2)Q1FY25指导超出预期。预计英伟达Q1 FY25总收入240亿美元,上下波动2%。除了业绩和指导,英伟达最大的亮点是,人工智能推理需求在数据中心业务中占40%,这验证了推理阶段的强劲需求,并为市场提供了一剂助推器。
英伟达与贝索斯投资机器人初创公司Figureee共同成立了具体的智能研究小组 AI。1)英伟达高级科学家Jimm Fan在推特上说,他将和Yukee一起工作 Zhu在英伟达成立了一个新的研究小组——GEAR,通用特定的智能体研究。未来,每台移动机器都将是独立的,机器人和模拟智能体将像iPhone一样无处不在。2)此前,英伟达首席执行官黄仁勋在中国台北举行了国际电脑展。(COMPUTEX)自主移动机器人平台ISaacac上演示 AMR,现场视频演示中使用的机器人底盘是9号公司的机器人移动平台。Isaac AMR是一个模拟、验证、部署、优化和管理独立移动机器人团队的平台,包括边缘到云的软件服务、计算和一套参考传感器和机器人硬件,可以加速独立移动机器人(AMR)开发和部署速度,降低成本,缩短产品上市时间。2)根据彭博社,亚马逊合伙人贝索斯、英伟达等大型科技公司将投资人机器人初创公司Figure AI ,为了为人工智能找到新的应用程序,英伟达和亚马逊附属基金将提供5000万美元。
英伟达进入ASIC,推理阶段的计算能力需求继续超出预期。1)据路透社报道,英伟达计划为云计算公司和其他企业设计定制芯片(ASIC)包括先进人工智能在内的新业务部门(AI)处理器。2)根据CSET报告,ASIC为特定用户和特定电子系统的需求而设计制造的集成电路具有体积小、功耗低、可靠性提高、性能提高、保密性增强、成本降低等优点 Chips:What They Are and Why They Matter,与CPU相比,ASIC芯片训练效率约为100-1000倍,速度约为10~1000倍,推理优于GPU。因此,我们认为在谷歌中、一方面,英伟达进入ASIC,有利于抢占市场,避免资源流失;另一方面,也是推理阶段计算能力竞争的早期布局,预计未来计算能力行业将呈现持续的高繁荣趋势。
投资目标:中科曙光、海光信息、浪潮信息、利通电子、新易盛、高新技术发展、中科旭创、工业富联、寒武纪、中国数字、恒为科技、软通动力、润建股份、万马科技、云赛智联、拓息、烽火通信等。
风险提示:技术迭代低于预期,经济低迷超出预期,行业竞争加剧。
报告正文
01英伟达的表现和指导超出预期,继续验证行业的高繁荣英伟达2024财年第四季度业绩超出预期,数据中心约40%的收入来自人工智能推理。第四季度收入达到创纪录的221亿美元,环比增长22%,同比增长265%。
数据中心业务:Nvidia,2024财年第四季度 Hopper 在GPU计算平台和Infiniband端到端网络的推动下,数据中心的收入达到184亿美元,创历史新高,环比增长27%,同比增长409%。2024财年数据中心约40%的收入来自人工智能推理。
游戏业务:2024财年第四季度收入为28.7亿美元,环比持平,同比增长56%。假期期间,消费者对Nvidia G Force RTXGPU的强劲需求优于我们的预期。年收入为104.5亿美元,增长15%。
专业可视化业务:2024财年第四季度收入4.63亿美元,环比增长11%,同比增长105%,财年收入15.5亿美元,增长1%。本季度的持续增长是由RTX数据架构的丰富组合和GPU的持续增长驱动的。为了支持数据准备、大模型、微调和检索、增强生成等与生成人工智能相关的工作负荷,企业正在更新其工作站。
汽车业务:2024财年第四季度收入为2.81亿美元,环比增长8%,同比下降4%。由于汽车制造商继续采用Nvidia驱动平台,年收入达到10.9亿美元,增长21%,首次突破10亿美元大关。
Q1 FY25展望超出预期,总收入预计为240亿美元。预计英伟达Q1 FY25总收入240亿美元,上下波动2%;游戏的季节性下降部分将抵消数据中心和专业版本的环比增长;GAPP和非GAPP的毛利率预计分别为76.3%和77%,上下浮动50个基点。随着公司继续投资面前的巨大机遇,2025财年GAPP和非GAPP的运营成本预计将增长30%左右;GAPP和非GAPP的其他收入预计为1.5亿美元,不包括非相关投资的损益;GAPP和非GAPP的税率预计为17%,上下波动为1%(不包括任何离散项目)。
这一次,英伟达到了第四季度的业绩,Q1 除了FY25指南超出预期外,人工智能推理需求占数据中心业务的40%,为市场增添了一剂强心剂。此前,市场对2025年人工智能计算能力进入推理阶段影响英伟达业绩的担忧在一定程度上得到了解决,并继续验证行业的高繁荣。
02成立了具体的智能研究小组,全面参与机器人、游戏和生成基础模型英伟达高级科学家成立了智能研究小组,建立了通用能力人工智能。杰米米,英伟达高级科学家 Fan在推特上说:“我将和老队友Yukee一起 Zhu在英伟达成立了一个新的研究小组——GEAR,通用特定的智能体研究。未来,每台移动机器都将是独立的,机器人和模拟智能体将像iPhone一样无处不在。正在构建一个基本的智能体:一个具有一般能力的人工智能,可以在许多虚拟和现实世界中学习如何熟练地行动。”
此前,NVIDIA 创始人兼首席执行官黄仁勋 COMPUTEX 在主题演讲中推出了新的独立移动机器人(AMR)平台 Isaac AMR,它可以为移动机器人带来先进的测绘、独立和模拟能力。现场视频演示 Isaac AMR 9号公司使用的机器人底盘是机器人移动平台RMP Lite 220。Isaac AMR 它是一个模拟、验证、部署、优化和管理独立移动机器人团队的平台。它包括从边缘到云的软件服务、计算,以及一套可以加速的参考传感器和机器人硬件 AMR 开发和部署速度,降低成本,缩短产品上市时间。
机器人的开发过程相当复杂,时间长,挑战大,成本高,NVIDIA Isaac 机器人开发平台提供端到端解决方案,降低开发成本,简化开发流程,加快产品部署。缺乏结构化的环境在许多用例和场景中也很常见。NVIDIA Isaac 机器人开发平台解决了这些挑战,端到端解决方案有助于降低成本,简化开发流程,加快产品上市。
贝佐斯和英伟达将加入我们 OpenAI 投资人形机器人初创公司 Figure。据彭博社报道,亚马逊合作伙伴贝索斯、英伟达等大型科技公司将投资人机器人初创公司 Figure AI ,为人工智能寻找新的应用。通过他的公司,贝索斯 Explore Investments LLC承诺投资1亿美元,微软将投资9500万美元,英伟达和亚马逊附属基金将提供 5,000 万美元。
03英伟达进入ASIC,推理阶段的计算能力需求继续超过预期英伟达成立了一个新的业务部门,并进入了定制芯片(ASIC)。据路透社报道,英伟达计划建立一个专注于为云计算公司和其他公司定制芯片的计划(ASIC)包括先进人工智能在内的新业务部门(AI)处理器。
我们认为:
l首先,抓住市场,避免资源流失。英伟达的客户竞相购买英伟达芯片,以便在快速崛起的生成人工智能领域竞争。然而,许多海外科技公司已经开始根据具体需求开发内部处理器。
其次,英伟达进入ASIC领域,是推理阶段计算能力竞赛的提前布局。
ASIC具有体积小、成本低的优点。ASIC是为特定用户和特定电子系统的需求而设计和制造的集成电路。ASIC的特点是面向特定用户的需求。ASIC具有体积小、功耗低、可靠性提高、性能提高、保密性增强、成本降低等优点.
ASIC推理明显优于GPU。根据CSET报告AIC Chips:What They Are and Why They Matter,与CPU相比,ASIC芯片训练效率约为100-1000倍,速度约为10~1000倍,推理优于GPU。
AIGC浪潮已经到来,进一步促进了对芯片和计算能力的需求。目前,由于互联网公司、云计算提供商和企业客户渴望将生成人工智能应用于自己的业务,计算能力供应短缺已成为该行业的普遍热点。
1、训练侧:GPT3.5对应数千张H100,多模态需求增加数倍至十倍。
GPT3.同级模型大约需要数千张H100进行训练。根据GPU 据Utils报道,Inflection表示,他们使用了大约3500个H100进行训练,与GPT3.5相当的大语言模型。2)同时,对于初创公司来说,需要几千个H100来培训大语言模型,几十个或者几百个H100来微调。
考虑到H100的价格约为每张3-4万美元,计算能力投资约为1亿美元。据快速科技报道,H100的价格约为人民币24万元,对应于每张3-4万美元。考虑到以Inflection为代表的公司的计算能力投资为3500,总投资约为1亿美元。
GPT4或数万张A100,GPT5或数万张H100。1)根据GPU 据Utils报道,GPT4可能在1000-25000张A100上训练。GPT5可能需要25000-5000张H100进行训练。2)GPT4的需求量与GPT3.5大约几千张H100相比,、GPT5等相对成熟的多模态模型的计算能力需求提高了几倍到十倍左右。
2、推理侧:只考虑文字问答场景,需要数万张H100,多模态提升空间广阔。
一、每日访问量:6000万。
2023年6月6日,据《科技创新板日报》报道,根据SimilarWeb的最新数据,2023年4月,OpenAI网站访问次数达到18亿次,每日访问次数约为6000万次。
2)用户平均访问时间:5分钟。
据《科技创新板日报》报道,每次访问时间约为5分21秒。
3)单个token输出所需时间:62.5ms;每秒生成token的数量:16个。
根据百度智能云的一些案例,Batch Size为1时,输出8个token大约需要353ms;Batch 当Size增加到16时,8个token的输出大约需要833ms。输出8个token的时间中值约为500ms(即0.5秒),即单个token的计算时间约为62.5ms(即0.0625秒),每秒生成约16个token。
4)平均实时并发:333.33万token//s。
6000万*(5*60)s*16token/s/(24*60*60)s=33.33万个token/s。
计算能力利用率:20%。
Transformer是自回归模型,这意味着在原始状态下,每生成一个新的token,都需要重新计算所有输入的token。
根据百度智能云技术研究,以175BGPT-3模型为例,输入1000个token,生成250个token:
•Context(即Encoder)阶段激活Shape[B,1000,1288],B是batch_size,第二维是输入token数,第三维是hidden size。
•对于Generation(Decoder)在阶段,由于每个输入输出都是一个固定的token,多个输出token是通过多个循环生成的,因此generation阶段激活shape的第二维度始终为1,generation的激活显存占用率远低于context阶段。
因此,Context是一项计算密集型的任务,而Generation是一项访问密集型存储的任务。这也意味着在推理阶段,由于显存带宽的限制,硬件的计算能力利用率将显著降低。
据百度智能云报道,一般来说,在线服务的GPU利用率不高,约为20%。此外,如果部署其用户态方案,确保在线服务的SLA相同,GPU资源利用率可提高到35%。
6)峰值倍数:10倍
推理服务的典型负载模式是一天中峰谷波动明显,短期流量会激增。据百度智能云统计,我们假设峰值倍数约为10倍。
7)计算能力总量:5.83*10^19FLOPS。
2*1750亿参数*333.33万token/s*计算利用率10倍/20%=5.83*10^19FLOPS。
8)H100数量:1.5-6万张。
根据英伟达官网,H1000 SXM INT8、FP16、TF32对应的计算能力为3958TOPS、1979TFLOPS、989TFLOPS对应的H100数量约为1.47、2.95、5.90万张。
我们认为,目前广泛使用的文本交互只是Chatgpt和AIGC应用形式的开始。语音、图片、视频等多模式的输入和输出可能会给内容创作领域带来革命性的变化。
更广泛的数据形式、更多的应用场景和更深入的用户体验也将大大提高支持人工智能的计算能力需求。英伟达进入ASIC,为推理阶段的计算能力需求提前计划,计算能力可能迎来一个快速扩张的时代。
10月10日,上交所再次举行券商座谈会,现场宣讲并购重组最新政策精神,并就进一步活跃并购重组市场、打通政策落地“最后一公里”听取意见建议。中信证券、中金公司、中信建投、华泰联合、国泰君安、国信证券、东方证券、广...
来源:券商中国作者:时谦今天早盘,A股市场波动较大,但经过一段下挫之后,很快就被多头拉起。而从盘面来看,以代码601开头的大盘蓝筹股(亦是高股息板块)今天表现非常突发,红利ETF大多涨幅在4%左右水平。那么,究竟又是何逻辑呢?分析...
中字头及红利资产全天保持强势,沪深两市交易量连续第4日突破2万亿元!市场对后续政策的期待仍在升温。今日(10月10日),A股三大股指走势分化,截至收盘,上证指数涨1.32%,深证成指跌0.82%,创业板指跌2.95%。全市场个股涨多跌少,超30...
要点1通化东宝控股股东所持股份质押率高遭质疑,公司董事长李佳鸿称,系东宝集团投资项目周期长造成;要点2业绩方面,李佳鸿预计称下半年公司营收将逐季恢复;要点3公司还对新产品销售情况做了介绍。财联社10月10日讯(记者 何凡...
要点1海外市场需求持续旺盛,赛轮轮胎预计公司前三季度业绩同比增约六成;要点2天然橡胶、炭黑、合成橡胶等生产原材料均有涨价,为应对成本压力,多家轮胎公司宣布产品涨价。财联社10月10日讯(记者 肖良华)海外市场需求持续旺...
本文“英伟达的表现和指导超出预期,继续验证行业的高繁荣”由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们!