阿里云大模型预训卡总量4万张,包括阿里巴巴大模型、集团和外部客户的需求。其中H8003000张,H100张,A1006000张,A800张,V1001.6万张。
折旧年限:我们将高端卡放置在全液冷服务器和防尘配套设施中。应该说,六年没有问题。液冷IDC技术相对成熟,但至少需要一年的时间才能批准建设并投入使用。
算力租赁:Corwave顶层调度能力比较优秀。国内算力租赁公司觉得还是屯卡。其实没有调度调优软件,壁垒挺高的。中国有单独的工作,比如陆晨科技,有点像我们的浩天平台。我们有这个能力(可以达到50%,可能比openai高),但是输出难,只能自用。因此,计算能力租赁的边际需求定价也有可能上涨到天空。目前,中国至少有100亿参数收敛到30多个真正的大模型,如百川智谱字节等。
盛腾:预训练还是比较难的。如果禁售持续,华为可以通过上下游协调做大异腾,但我觉得至少需要五年时间,因为他绑定了他的mindspore,不支持32个浮点操作,但阿里巴巴腾讯现在是自己的开发框架,很难迁移,禁售可能会改变。另外,云厂商不是普通客户,对迁移还是很谨慎的。因此,我认为英伟达高端算力在中国五年内是极其稀缺的资源。对于参数相对较小的模型,华为寒武纪可能有市场。
我们内部也很纠结。很多A800和H800订单都没有交付,估计以后不能交付(先付后付)。我们将在12月初获得H20和L20的测试卡。
腾讯去年做了一些野生拿卡渠道,所以挖矿公司拿卡应该是真的。我们没有这样做,害怕受到惩罚。
H200的性能是H100的两倍,HMB有很大的升级,所以插件SSD会很大。然而,光模块不会显著增加,卡间交互光模块明年可能升级为1.6T或硅光。
目前国内大型模型还没有达到GPT3.5的能力,都是3多一点。国内排名通义第一,最全面,第二是智谱。一些银行项目落地,其次是百川和百度。
对于模型制造商来说,即使计算能力足够,扩大模型的成本也是巨大的。硬件成本占40%,劳动力占10%。此外,运营成本高。例如,妙鸭相机只使用100张卡进行训练,但在运营高峰期需要500张卡,因此他意识到这必须限制流量,因此他将推迟。
现在正在制作chiplet封装的Al芯片,如摩尔线程、沐曦科技等,也是一种调度和调优的创新。深入研究
上一篇:经济见底,股市也有反弹预期
10月10日,上交所再次举行券商座谈会,现场宣讲并购重组最新政策精神,并就进一步活跃并购重组市场、打通政策落地“最后一公里”听取意见建议。中信证券、中金公司、中信建投、华泰联合、国泰君安、国信证券、东方证券、广...
来源:券商中国作者:时谦今天早盘,A股市场波动较大,但经过一段下挫之后,很快就被多头拉起。而从盘面来看,以代码601开头的大盘蓝筹股(亦是高股息板块)今天表现非常突发,红利ETF大多涨幅在4%左右水平。那么,究竟又是何逻辑呢?分析...
中字头及红利资产全天保持强势,沪深两市交易量连续第4日突破2万亿元!市场对后续政策的期待仍在升温。今日(10月10日),A股三大股指走势分化,截至收盘,上证指数涨1.32%,深证成指跌0.82%,创业板指跌2.95%。全市场个股涨多跌少,超30...
要点1通化东宝控股股东所持股份质押率高遭质疑,公司董事长李佳鸿称,系东宝集团投资项目周期长造成;要点2业绩方面,李佳鸿预计称下半年公司营收将逐季恢复;要点3公司还对新产品销售情况做了介绍。财联社10月10日讯(记者 何凡...
要点1海外市场需求持续旺盛,赛轮轮胎预计公司前三季度业绩同比增约六成;要点2天然橡胶、炭黑、合成橡胶等生产原材料均有涨价,为应对成本压力,多家轮胎公司宣布产品涨价。财联社10月10日讯(记者 肖良华)海外市场需求持续旺...
本文“阿里云大模型预训卡总量4万张”由壹米财经整理发布,欢迎转载收藏,转载请带上本文链接。
免责声明:【壹米财经】发布的所有信息,并不代表本站赞同其观点和对其真实性负责,投资者据此操作,风险请自担。部分内容文章及图片来自互联网或自媒体,版权归属于原作者,不保证该信息(包括但不限 于文字、图片、图表及数据)的准确性、真实性、完整性、有效性、及时性、原创性等,如有问题,请联系我们!