行情频道: 行情 / 知识 / 新股 / 要闻 / 基金 /

阿里云大模型预训卡总量4万张,包括阿里巴巴大模型、集团和外部客户的需求。其中H8003000张,H100张,A1006000张,A800张,V1001.6万张。

折旧年限:我们将高端卡放置在全液冷服务器和防尘配套设施中。应该说,六年没有问题。液冷IDC技术相对成熟,但至少需要一年的时间才能批准建设并投入使用。

算力租赁:Corwave顶层调度能力比较优秀。国内算力租赁公司觉得还是屯卡。其实没有调度调优软件,壁垒挺高的。中国有单独的工作,比如陆晨科技,有点像我们的浩天平台。我们有这个能力(可以达到50%,可能比openai高),但是输出难,只能自用。因此,计算能力租赁的边际需求定价也有可能上涨到天空。目前,中国至少有100亿参数收敛到30多个真正的大模型,如百川智谱字节等。

盛腾:预训练还是比较难的。如果禁售持续,华为可以通过上下游协调做大异腾,但我觉得至少需要五年时间,因为他绑定了他的mindspore,不支持32个浮点操作,但阿里巴巴腾讯现在是自己的开发框架,很难迁移,禁售可能会改变。另外,云厂商不是普通客户,对迁移还是很谨慎的。因此,我认为英伟达高端算力在中国五年内是极其稀缺的资源。对于参数相对较小的模型,华为寒武纪可能有市场。

我们内部也很纠结。很多A800和H800订单都没有交付,估计以后不能交付(先付后付)。我们将在12月初获得H20和L20的测试卡。

腾讯去年做了一些野生拿卡渠道,所以挖矿公司拿卡应该是真的。我们没有这样做,害怕受到惩罚。

H200的性能是H100的两倍,HMB有很大的升级,所以插件SSD会很大。然而,光模块不会显著增加,卡间交互光模块明年可能升级为1.6T或硅光。

目前国内大型模型还没有达到GPT3.5的能力,都是3多一点。国内排名通义第一,最全面,第二是智谱。一些银行项目落地,其次是百川和百度。

对于模型制造商来说,即使计算能力足够,扩大模型的成本也是巨大的。硬件成本占40%,劳动力占10%。此外,运营成本高。例如,妙鸭相机只使用100张卡进行训练,但在运营高峰期需要500张卡,因此他意识到这必须限制流量,因此他将推迟。

现在正在制作chiplet封装的Al芯片,如摩尔线程、沐曦科技等,也是一种调度和调优的创新。深入研究

相关阅读

本文阿里云大模型预训卡总量4万张由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们! 分享到: 新浪微博 微信

扫描左侧二维码
看手机移动端,随时随地看 股票 新闻