以ChatGPT为代表的生成式AI大模型热潮持续发酵,但AI要广泛应用,运算能力就显得非常重要。
在生成式AI、大模型带动的算力需求下,有权威机构预计,未来5年,中国智能算力规模的年复合增长将达52.3%。华为更是预估,2030年相比2020年,AI爆发带来的算力需求将增长500倍。
其中,AI服务器成为增长的主力军。根据TrendForce的数据显示,预估2023年AI服务器出货量近120万台,年增38.4%,2022-2026年AI服务器出货量的年复合增长率将达29%。
值得注意的是,今年由于市场需求大增,上游高端GPU芯片持续缺货,AI服务器价格一年涨近20倍。
在可见的未来,不仅大模型厂商需要庞大的算力,AI初创企业、传统产业转型的企业也需要算力支撑。众多的垂直行业企业将会采取调用其API或直接在大模型上进行专业训练,形成“小模型”以及各类行业应用。
但算力不足是国内企业面临的普遍问题。对于大多数中小企业而言,本地部署AI服务器、搭建大模型算力几乎是不可承受的开支。
为此,今年3月,英伟达提出一个新的模式——算力租赁。
目前业内普遍认为,只有通过超大型数据中心提供算力租赁的方式,才能解决中小企业算力不足的问题。
【多地政策支持算力租赁】
算力租赁,顾名思义就是对算力进行出租,是一种通过云计算服务提供商租用计算资源的模式。
企业用户可以根据自己的需求租赁服务器或虚拟机实现大规模的计算任务,而无需拥有自己的计算资源。
算力租赁是一种灵活、高效、成本低廉的计算服务,适用于各种大规模计算需求的场景。
与此同时,算力租赁板块也获得政策层面的大力支持。近期,上海市发展改革委发布的《上海市加大力度支持民间投资发展若干政策措施》提出,鼓励国企、政府部门租用民间投资算力资源。此外,北京、深圳等地也纷纷提出支持算力租赁领域发展。
【英伟达推出算力租赁服务】
今年3月,英伟达CEO黄仁勋宣布了DGX Cloud算力租赁服务计划,让企业用户不需购买昂贵的AI服务器,就能在云端上使用其提供的运算能力。企业用户可以使用DGX运算资源来进行生成式AI或应用开发。
据悉,DGX是英伟达推出的AI超级电脑运算系统,此次新推出的DGX Cloud算力租赁服务是英伟达与甲骨文等合作伙伴共同打造的。
至于DGX Cloud服务的订阅收费,未来将按照每个实例/每个执行个体来计算,每月收费36999美元起。每个实例包括8个NVIDIA H100或A100 Tensor核心GPU,每个GPU节点内存高达640GB,实现计算资源专用,不和云中另外的租户共享。
此外,DGX Cloud本身也支持英伟达自家的AI软件和开发工具,比如Nvidia AI Enterprise提供端到端的AI框架与预训练模型。
算力租赁的市场正不断扩大,受益的厂商将越来越多。算力租赁业务需要相关的计算机硬件设备、电力和网络基础实施等供应链资源的配合,国内部分厂商已经开展算力租赁相关业务,算力云端租赁服务商将成为最大受益者。
根据同花顺财经统计数据显示,国内有30多家上市公司入选“算力租赁”概念,包括鸿博股份、贵广网络、美利云、拓维信息、特发信息、南兴股份、工业富联、紫光股份、浪潮信息、证通电子、世纪华通、同方股份、四川长虹、利通电子、青云科技、协鑫能科、中装建设、顺网科技、南凌科技、亚康股份、城地香江、中青宝、立昂技术、铜牛信息、浙大网新、朗源股份、首都在线、中科曙光、东方国信、思特奇、汇金股份、润建股份润泽科技、飞利信等。