会议要点
1. 国内AI算力市场供需及价格动态
NV卡价格稳中有升,市场放出消息称英伟达产品h100、h20、b100价格降低,实际价格波动不超过10%,h100约在2.5万美金左右。
国内对h20的采购意向存在,但采购量相较以前有波动,国产卡的性价比相对更高,考虑到美国限制,h20的保持续性存在担忧。
实际测试显示,h20单卡效能仅为h100的20-30%,但集群效果较好,若价格低于1万美金,有吸引力。最佳情况下,h20堆叠效果可接近h100的90%。
2. AI算力市场供求与显卡抢购
当前AI算力市场供方优势显著,国内抢购现象严重,需求量大,主要厂商如BAT和字节跳动等需求旺盛。
NV卡缺货,与英伟达合作需排队。
AI能力提升带动算力需求增加3-5倍甚至更多,实际使用中可能还要更高,芯片供应紧张。
3. AI算力市场现状及风险探讨
AI算力应急解决方案:大厂在面临H800H100芯片缺口时,不倾向于通过转口贸易等非正规渠道解决,因为风险大、量不可控,且对业务帮助有限。
海外业务拓展:大厂正尝试在海外建立国际中心,开展海外大模型训练,引导头部客户在海外进行业务训练和拓展,作为长期迭代和增长策略的一部分。
AI应用需求预期:尽管现在应用需求增速不大,24年有望迎来爆发,目前的重点在算力储备及相关能力提升。例如,钉钉通过提供基于AI大模型的增值服务积累经验,预计三年内产品增长至30~50%市场份额。
4. 国内AI算力与显卡供需探讨
英伟达目前领先AI算力,但国内厂商正努力提升部分能力以满足业务需求,并愿意承担兼容性成本,算力需求呈非线性增长,预期会逐步高企。
国产AI芯片如升腾910D性能接近NVIDIAA100,与H20相比有优势,但在生态适配性、开发框架兼容等方面仍存在差距,逐步替代英伟达有一定难度但态度乐观。
华为910B供应紧张,需求量大,互联网大厂如阿里云手头存量紧张,几乎无新交付,算力资源紧缺可能制约公司业务发展。
5. 国内AI算力供求与市场分析
市场上大厂主要与运营商和IPC等大企业合作,避免与小厂合作,部分原因是价格不合适、供需关系紧张。
国内AI算力需求旺盛,租赁价格上涨超过50%,云服务商内部需求也在抢占算力资源。
国产AI芯片在大型模型款项及产能上仍有不足,但特定领域如浮点数计算有优势,华为等大企业保持资源及供应链优势。
6. AI算力补贴及市场应用分析
国家算力券政策类似于光伏行业补贴,但补贴力度有限且有额度上限,对不同行业和企业情况有不同的兜底政策;力度有,但并非特别大。
H20样片单卡性能测试结果约为标称性能的80%,但缩水程度因场景不同而异;现实中缺乏多卡情况的全面测试,阿里云未有出售H800卡的消息。
根据对阿里集团算力需求的估算,若考虑各项因素,存在算力短缺可能性,预估缺口可能是一半;L20卡相对H20是阉割版,目前阿里对L20无明确采购计划。
Q&A
Q:关于市场上传言英伟达的显卡降价,诸如H100降至2万美金,H20降至1.23万美金,B100降至3万美金,这些传言是否属实?
A:从目前的情况来看,整体价格是稳中有升。尽管存在波动,但整体而言价格比较坚挺。尤其考虑到需求的增长速度可能超过线性增长,以及原材料和供应链状况的影响,整体价格保持坚挺。
Q:目前H100的实际市场价格是多少?
A:我们目前的情况是没有具体的数,主要是因为没有采购H100。不过整体的价格波动趋势显示,标准用户购买的价格波动不会超过10%,最近一个季度的价格大概在2.5万美金左右,波动不大。
Q:H20的供货情况如何,国内有大厂有采购H20的计划吗?
A:关于H20的供货,目前的预计可能要到第一季度才逐渐进入市场,且具体时间还不确定。有些大厂确实表示对H20有采购意愿,但采购比例会有较大波动。从性价比来看,国产卡可能高于H20,因为实际测试表明,H20的性能并未达到预期,且可持续性较差。考虑到后续可能的政策限制,采购的整体量可能会比以前有所严格或缩减。维保方面,一旦出现问题,现在的政策可能会影响到能否替换同款芯片,导致库存减少。
Q:H20在单卡算力效果、集群效果和公共模型规模持续性方面的测试结果吗?
A:H20的单卡性能相比H8版或早期版本有较大差异,可能仅达到H100的20%-30%。集群效果相比之下较好;对于特定场景的垂直模型参数训练,H20与H800相比大约会有10%-20%的性能差距。短期来看问题不大,但由于大模型更新速度快,长期的可持续性存在担忧。关于H20的定价,个人认为低于1万美金可能会是较有性价比的选项,但目前这样的价格比较难以实现。
Q:目前国内AI算力的供求情况如何?英伟达(NVIDIA)显卡的市场需求有何变化?
A:目前市场供求关系呈现出供方具有更大优势的情况,国内对算力的抢夺十分激烈。与英伟达的交流表明,未来可能需要排队购买其显卡,表明需求量很大。无论是BAT(百度、阿里巴巴、腾讯)还是如美团、字节跳动等大厂,需求量都相当大。尽管大家口头上支持国产化,但与英伟达的合作实际上推进得较快。
Q:国内何时可能达到4.0的技术水平?海外的情况如何?
A:国内厂商最初目标是在3到4月份推出4.5相似的产品,但可能因供应链影响而延期,不过不会超过6月。至少有几家头部企业会发布。相比之下,海外可能在两个月内推出4.5版本。质谱公司宣布接近4.0水平。我们通过分析发现,质谱公司的产品在中文领域的性能确实比GPS好,但在中英转换或者指令跟随方面略逊一筹。
Q:国内AI算力需求增加情况怎样?是否因技术升级导致算力紧张?
A:国内的算力需求非常紧张。以我们自己的升级预估来看,从3.5版升级到4.0版的需求至少增加3到5倍,甚至更高。除非有持续优质的芯片供应提升算力,否则整体控制会很难。目前外资的算力供应已经暂停,官方网站和其他渠道难以找到外租服务,导致算力非常稀缺,有些厂商甚至尝试使用非正规途径获取显卡。
Q:国内AI算力供求情况如何?是否存在NV显卡的供应问题?
A:关于国内的AI算力供求情况,主要的制约点在于硬件方面,特别是NV显卡的供应。有一些非传统贸易方式,例如转口贸易,能够缓解供应压力,但这种方式对大厂而言风险较高,且对业务的实质帮助有限。因为这些非规范的贸易形式供应周期和数量都不太可控,只能作为应急使用,大厂更倾向于通过在海外建立业务分支的方式去探索海外大模型训练等业务拓展。
Q:目前AI算力的应用和需求情况如何?
A:AI算力的应用和需求正在增加,主要集中在各个行业的Top企业。例如泛互联网行业的米哈游和网易,物流行业的中通和圆通,以及汽车制造业的奇瑞和小鹏等。目前大厂已经尽量减少对算力的租赁,更专注于业务探索和迭代。值得注意的是,当前整体增速暂未展开,预计到2024年会出现一个爆发期。目前阿里云等大厂正在积累储备并做一些应用探索,比如推理场景和推荐场景的应用数尚未大规模增长,客户数和活跃用户数仍有较大提升空间。
Q:算力需求的未来展望以及海外竞争对手的情况怎么样?
A:对于算力需求的未来展望,预计将越来越夸张,随着技术不断迭代,海外竞争对手如OpenAI的规划看起来非常激进,预计未来算力需求将会达到一个很高的水平。从现有趋势来看,GPU及相关芯片领域是一个较好的赛道。我们预计,按照目前开发进度,如果支撑得好,2024年底有望见到技术进一步的迭代。不过有许多不确定因素,包括专利的制约等问题,需要关注。
Q:目前国内AI算力供求情况如何?NV卡的市场表现怎样?
A:目前英伟达在市场上确实处于领先地位,但国内的厂商也在积极进入市场。虽然不能完美替代英伟达,但某些特定项能力已经达到很好水平,满足市场需求。国内厂商愿意承担成本以实现产品兼容。算力需求将呈现高速增长,而非线性增长。国内卡如海光、寒武纪等,其单卡性能已经非常出色,有些接近甚至超过了Nvidia的H20,升腾910D单卡性能尤为强劲。但国产卡还存在生态适配性和兼容性上的一些问题,这些预计会在未来的版本更新中解决。就华为910B芯片的供应而言,目前市场上非常紧张,订单可能需要三个月到半年才能得到满足,且单量至少有5000张的需求。
Q:当前国产AI芯片如升腾的情况是怎样的?互联网大厂在AI芯片方面的需求有何变动?
A:2020年出现的升腾9201芯片,在应对大规模场景时表现出色,而920C的发布将进一步解决现有问题。尽管完全替代英伟达仍存在困难,但国产芯片已经能够作为训练大模型的可靠选择。如果没有政策增加障碍,对国产芯片的前景相对乐观。而在互联网大厂的层面,从去年11月份以来,新订的芯片并没有太大变动,A100的存量大约是四五千张,主要供应给集团内部使用。去年之前总共有近1万张的存量,包括提100来10等旧款和国产芯片。整体加起来也就七八千张。阿里云虽然考虑过分拆独立,但后又停下来,一个原因可能是担心分离后集团内部的算力资源供应问题。
Q:国内的大厂对于存量NVIDIA显卡的态度如何?目前AI算力的租赁价格趋势是怎样的?
A:国内大厂在显卡供应紧张的情况下确实对存量的NVIDIA显卡有一定的需求,并且会有针对性地与企业合作,包括与运营商和IPC等合作。但这些合作相对较少,原因是市场上的现有显卡价格较高,不太合适。至于AI算力的租赁价格,从我们的经验来看,价格已经上调了50%以上,体现出了租赁市场的紧张局势。
Q:国产AI芯片相较于NVIDIA显卡的性能如何?大厂对国产AI芯片的态度是什么?
A:国产的AI芯片如海光的性能在整体兼容性或是对大模型的适配程度上仍有待提升。寒武纪的产品虽然进步明显,但仍难以满足大规模模型训练的需求,且产量暂时跟不上。华为由于有完善的供应链,情况可能会好一些。短期内,大厂可能还是会以使用NVIDIA产品为主,同时持续观察其他品牌的情况,并进行少量采购。目前国产AI芯片在响应市场变化和模型恢复上表现出迅速的动作,预期它们的推进速度可能会超出市场预期。至于未来的采购决策,大厂可能仍会关注国产化的进展,进一步观察。
Q:目前企业对于AI算力的需求情况如何?特别是在自动驾驶和智能硬件方面。
A:对于AI算力的需求,自动驾驶领域的车企都有上千张显卡规模的需求,这涵盖模型训练和计算中心的储备。其他智能硬件,如扫地机器人和智能音箱等,虽然它们集成了终端芯片,但在模型训练方面同样有数百张显卡的规模需求。大型车企在合作时通常选用NVIDIA的产品来满足他们的算力需求。
Q:国家层面对于推动算力基建有什么政策?这些政策对于解决供给端问题有何影响?
A:的确有听说国家将推动一些算力基建的政策。预计大厂将不会是这些项目的牵头方,但国家很可能会与运营商合作来推动相关建设。运营商自己具备资源并可能与国产厂商如华为进行合作。此外,国家出台的计算中心项目对国产化的要求较高,因此对国产供应会有一定的支持作用,虽然当前全球供应紧张的局势对国家计算中心的建设有影响,但可能影响会相对较低。
Q:算力券目前是什么样的抵扣形式?补贴效果如何?
A:算力券相当于是抵扣,其实各个省市都有自己的专利券,可以用于完成整个正常注册或企业资质的相关费用,对于中小企业、专精特新企业、高校和科研机构都有应用。抵扣额度不能超过整个支出费用的40%至50%,并且用户每年的申领额度有上限,大约在三五十万量级。补贴力度虽然存在,但并不是特别大,总体上对于行业的支持处于一个比较好的政策阶段。补贴金额一般是千万量级,但具体力度大小不易衡量,每年发放的总额有限制。
Q:H20的测试情况怎么样?是否能达到标称的性能?
A:H20的测试是基于单芯片样片,通过内部模型训练来评估单卡的效果,以及推测在咨询效果下作出综合评价。目前看来,H20标称性能大概能达到8成左右。但没有条件测多卡情况下的性能,关于这方面的评估还没有准确结果。目前没有足够的样片进行更多的资源后续价格测试,而且Q1的时候提到的样片放量到当月现在还没有下文。对于A100和H100这类卡的性能比较,单卡性能上并不具备很大竞争优势,主要还是依赖于整体集群规模优势和带宽。目前的策略是少量采购,先付一部分预算进行尝试。
Q:现在NV卡的使用情况如何?例如A100的性能和市场竞争力?
A:关于NV卡,目前以F16为主,也有谣言说阿里云卖掉了一些自己的H800卡,但据我所知这应该不属实。从竞争力来说,A100等卡单卡性能并不是特别大的优势,更多的依赖于整体的集群优势。
Q:FP8精度对算力需求的影响?
A:目前我们还没有使用FP8精度来做训练,而是以F16为主。如果使用FP8精度,对算力的需求会有减少,但具体减少多少并不太固定,不一定是减少一半。
Q:目前对L20的看法?
A:L20相对于H20来说应该算是一个阉割版本,虽然有好有坏,但目前对这款卡还没有太多的使用意向。