2023年以来,火热的AI点燃了算力产业链,其中关键的存力需求大幅上升。
【资料图】
近日,在2023中国算力大会上,中国信息通信研究院院长余晓晖介绍道,到今年6月,相比去年同期,我国存力规模增长了23%,达到了1080EB。
为何存力越来越受到重视?因为不论大模型演进还是算力中心发展,都离不开海量的数据基础,和数据息息相关的存储环节扮演着重要角色。
中国工程院院士倪光南在会上指出:“各地都在建AI算力中心,往往大家关心的就是每秒多少次的运算,这是算力,这显然很重要。但是AI计算从科学的角度来看应该用广义的算力来表示,存力、算力和运力三者合起来构成广义算力。”
他进一步谈道,数据显示,预计2025年中国数据量将从7.6ZB增至48.6ZB,超过美国成为全球第一,“毫无疑问中国是未来数据量最大的国家,是数据大国,希望变成数据强国。”
存储技术的新机遇
目前,算力已经成为关键生产力,成为支撑数字经济高质量发展的新动能,其中的数据存力也越来越受到关注。
从规模而言,国内的存力市场在不断扩大。余晓晖表示,从区域上看,东部地区存力发展整体水平高,中西部地区受“东数西算”政策的推动,发展速度加快。从行业上看,我国的金融、电信、政府等行业的数字化进程快,这些领域里的先进存力占比已经超过了23%。
但是对比全球看,国内存储产业仍有不足之处。根据倪光南提及的一组数据,美国存算比为1.11TB/GFlops,而中国为0.42TB/GFlops,仅是美国的37.8%,这反映出中国在算力配置之中还有改进余地。
同时在产品层面,虽然中国存储容量增长快,但主要用机械硬盘HDD,先进存储技术相对滞后。
比如,存储领域闪存市场占比中,全球平均水平为41.3%,美国为56.4%,中国为20.3%,仅是全球水平的一半。
而眼下,新一轮的存储技术变革正在开启新机遇。倪光南指出:“特别是我们看到,当前存储领域正在从机械硬盘向半导体存储演进、转化的产业升级。我们应该抓住时机,趁着AI算力的发展加速存储的发展,同时也促进我们的存储领域从机械存储向先进存储发展,进行技术的革新。”
在倪光南看来,随着国产存储整机和闪存生产能力提升,SSD(固态硬盘)取代HDD(机械硬盘)的时机已经到来。
硬盘是企业级存储的主要部件,是保存数据的关键介质,主要包括HDD和SSD两大类。《中国存力发展报告(2023年)》显示,SSD在2022年的全球出货容量为318EB,达全球存储总量的20%。据IDC预测,至2025年,全球SSD出货容量将进一步上升到805EB,占全球存储总量的25%。在企业级存储应用中,基于SSD的全闪存储使用范围不断扩大,具有良好的发展前景。
目前国内产业链也有不小进展。倪光南表示,上游的长江存储发展得不错,目前的市场份额大概为5%左右,其在性价比和工艺上已经达到了世界先进水平,具备国际竞争力,上游芯片基本上可以提供支持;中游企业中,如华为等推出的产品,其技术可以与国际最新的技术相比拟,而且市场份额很大。
“过去的观念中,常常把存储产品看作配件,现在存储非常火,从芯片、软硬件到系统,是非常巨大的产业,数据存储产业可能是一个万亿美元的市场,希望能把数据存储产业抓好,在国际市场上可以塑造新的名片,引领市场的发展。”倪光南说道。
“以存强算”促AI发展
随着AI大模型的应用,业内对于数据、存储的重视度也越来越高。
华为公司副总裁、数据存储产品线总裁周跃峰谈道:“仅仅一个大模型是毫无价值的。我们必须喂给它知识、知识库、语料库,它才能够针对我们的场景形成咨询师,形成编程的机器人,形成客服的机器人,让它具有自己学习的大脑。”
这也意味着,数据的质量、数据的处理效率,是AI大模型发展最为关键的一个部分。周跃峰还特别提到,(训练大模型时)英文训练的效果比中文训练要好,是因为英文存下来的数字化资料远远多于中文。
“所以我们认为,中国在未来AI时代要持续领先,一个很重要的基础就是必须具备很先进的存力。存在先进存力上的信息太少了,将极大地制约中国AI的发展。”周跃峰说道。
他还谈到了国内存力发展的两大建议,其一是要充分认识到以存强算,“今天中国数据中心三大力量是算力、存力和运力。算力在短期之内,5年、10年想领先暂时不可能,但是以存强算可以让中国的数据IT、基础设施持续保持领先。”
所谓“以存强算”,是通过存力的升级来提升算力整体性能。举个例子,在AI大模型的系统中,可以把数据的预处理提前在存储环节做好,然后再把数据传给GPU,让GPU更加高效地工作。在周跃峰看来,在未来5-10年当中,“以存强算”能够真正实现中国算力基础设施在全球的领先。
此外,周跃峰还提到了先进介质的应用,“今天全世界只有3家公司可以生产硬盘,分别是西数、希捷、东芝。但是中国经过5-6年的努力,已经有了长江存储、合肥长鑫等企业,他们有自主知识产权的半导体介质的使用、生产的能力,而且产能足够。”
眼下,算力中心兴起的同时,存力中心也在持续落地。《中国存力发展报告(2023年)》指出,目前算力基础设施的发展也在由概念走向落地,为存力的发展带来了良好契机,我国各省份在制定政策时不再只是定性描述发展目标,逐渐开始提出相关定量指标。
比如,针对数据中心存储规模,山东、湖南提出了到2025年,存力规模目标达到50EB的目标,贵州提出要突破60EB;针对先进存储,上海、山东、广西、宁夏、湖南、四川、福建等省份均提出了先进存储建设要求。
与会的多位专家表示,数据存储技术的迭代,带来了更多的商机和发展空间。接下来还需要加强存储技术的攻关,深化存力和生成式AI等应用的融合,同时还需要重视数据安全、提高数据管理效率。