行情频道: 行情 / 知识 / 新股 / 要闻 / 基金 /

事件:多模态大模型的计算能力需求远高于纯文本模型。以Gemini为例,其强大的多模态能力背后是巨大的计算能力需求。虽然没有正式公布,但根据内部消息,Gemini有万亿参数,训练中使用的计算能力甚至是GPT-4的五倍。解读:

多模态的意义

Gemini1.0号称具有本地多模态能力,能处理视频、音频、图像、文本、代码等多种形式的内容,性能优于现有的“拼接”多模态大模型。从谷歌官方发布的技术文档中的例子来看,Gemini不仅可以转换双模态(如文生图片或文生视频),还可以处理需要多模态转换的复杂任务。多模态的意义在于,它为人工智能应用带来了更多的可能性,即通用人工智能(AGI)发展的关键。从这个角度来看,Gemini的推出是人工智能产业发展的一个里程碑,其代表的本土多模式大模式有望拓展大模式的应用场景和边界。国盛证券表示,Gemini的出现有望为行业贡献大模型泛化能力的新范式,加速AIGC向AIGC的发展 Agent的转变。作为科技巨头,谷歌拥有丰富的软硬件生态。国海证券表示,如果谷歌将其产品完全连接到Gemini,其搜索引擎和办公软件将能够与微软的Newbing和Microsoft合作 365 Copilot对抗;此外,谷歌还可以在配备Android系统的移动设备上推出Windows 人工智能助手Copilot,充分发挥其在2C端的用户优势,顺应当前人工智能手机的发展趋势。开源证券表示,科技巨头之间的多模式大模型竞争日益激烈,推动了底层多模式大模型能力的持续突破。随着GPTS等人工智能应用形式的出现,人工智能应用预计将迎来一个快速增长的时期。开源证券表示,科技巨头之间多模式大模式的竞争日趋激烈。与此同时,它推动了底层多模式大模式能力的不断突破。随着GPTs等人工智能应用形式的出现,人工智能应用有望迎来一个快速增长的时期。计算能力是中流砥柱。多模式大型模型的计算能力要求远高于纯文本模型。以Gemini为例,其强大的多模态能力背后是巨大的计算能力需求。虽然没有正式公布,但根据内部消息,Gemini有万亿参数,训练中使用的计算能力甚至是GPT-4的五倍。与传统大模型对英伟达硬件和生态的依赖不同,Gemini训练所需的计算能力是基于谷歌自主研发的TPU v4、v5e等硬件。在推出新模型的同时,谷歌宣布推出最强大、最高效、可扩展性最强的TPU系统Cloud。 TPU v5p,将用于开发更多的人工智能大模型。其TPU v5p的训练性能是上一代TPU v4的2.8倍,内存带宽的3倍,芯片间互联带宽的2.8倍,4.8倍Tbps,与此同时,V5p单POD中的芯片数量翻了一番,达到了8960个。

另一方面,因为Gemini Nano登陆谷歌Pixel 8 Pro手机,端侧计算能力也受到重视。高通此前发布的报告显示,未来人工智能推理的规模将远高于人工智能培训,推理成本将随着日常用户数量和使用频率的增加而增加,云推理的成本掌握在云制造商手中,这将导致规模扩张难以持续,因此安排端计算能力是生成人工智能规模扩张的关键一步。看看全球AI行业,OpenAI于11月发布了GPT-4 谷歌随后发布了Gemini,这表明人工智能巨头在大模型领域的竞争仍然白热化。民生证券认为,谷歌作为自主研发计算能力的新力量,有望激化计算能力市场的良性竞争,进而降低计算能力使用成本。计算能力基础设施产业链将继续受益于海外互联网巨头AI模型军备竞赛。国盛证券还表示,谷歌有望为计算能力供需提供新的选择。从供给方面看,有利于技术的良性竞争。从需求方面看,充分的市场竞争也有利于降低计算能力的使用成本。平安证券表示,在此背景下,人工智能计算能力需求的增长将继续乐观。国信证券还表示,除了ChatGPT,绘图、视频等人工智能应用取得了进展,培训和后续推理需求持续,计算能力基础设施长期繁荣持续。AI算力产业链的主题早8点:Gemini有万亿参数,训练中使用的计算能力甚至是GPT多模态概念:Gemini有万亿参数,训练中使用的计算能力甚至是GPT

相关阅读

本文Gemini有万亿参数,训练中使用的计算能力甚至是GPT由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们! 分享到: 新浪微博 微信

扫描左侧二维码
看手机移动端,随时随地看 股票 新闻