内容提要:人工智能时代是算力驱动下人类经济社会发展的新阶段,算力是人工智能时代国家和区域的核心竞争力。从全球竞争态势来看,中国算力基础设施部署具有一定的先发优势,算力市场快速发展,云服务企业快速涌现,算力需求场景不断拓展,并在需求拉动和创新驱动下实现了技术的快速进步,为人工智能时代经济的高质量发展创造了新的技术和市场条件。与此同时,中国的算力设施利用效能和市场结构、企业全球竞争力、商业价值实现等面临现实困难,且在美国的极限打压下,产业安全和国家安全面临严峻挑战。为此,需要把握技术、市场和政府驱动算力市场发展的逻辑,前瞻性部署基础设施建设并强化算网协同,开拓更多发展场景,加大对算力市场中核心云服务企业的培育,立足新竞争形势强化底层技术突破和国产替代,以高质量的算力市场建设构筑中国在人工智能时代的竞争优势。 关键词:算力市场;人工智能;高质量发展;新质生产力 |
一、引言
算力是人工智能时代的核心基础设施(李平等,2021),也是国家和区域新型竞争力的重要来源。算力本质上是冯·诺依曼架构在“万物可算”大计算时代的延伸和拓展,包括计算、存储和网络三大核心内容,也就构成了信息计算力、数据存储力和网络运载力这一综合算力(温小振等,2024)所形成的新质生产力。其中,计算力是指多种类大规模芯片(如CPU、GPU、FPGA等)集群形成的通用算力、超算算力和智算算力,以及位于边端的边缘算力;存储力是指基于多种存储介质(通常是硬盘、磁带、光盘等)形成的存储阵列、存储设备构成的数据中心;运载力是通过多种网络互联网方式(有线和无线)对计算力、存储力的互联,尤其体现了数据中心内部以及相互之间的联结,并最终将计算力和运载力以云计算和大数据的方式呈现给用户。从产业链视角来看,算力市场可分为三个主要环节:上游算力装备的制造、数据的获取和加工;中游算力设施的建设和运营;下游的算力应用。具体来看,上游算力装备的制造不仅包括系统装备的制造,更体现在多样化零部件与元器件的制造和购买,其微观主要表现为集成电路构成的各类芯片及其产品;数据的获取和加工主要涉及组织和个人数据的获取,不仅存在获取成本的问题,更暗含了安全性、伦理、隐私等一系列社会和法律问题。中游算力设施主要包括各类数据中心、云计算中心、超算中心、交换中心等,也构成了算力最为显性的部分。下游的算力应用十分多元且分散,包括针对企业端(B)、政府端(G)、消费端(C)等提供的各类SaaS(Software as a Service)、IaaS(Infrastructure as a Service)和PaaS(Platform as a Service)服务,是数字经济发展的基础能力和支撑工具,不仅推动了企业的数字化转型,也通过数字化、网联化、智能化改变了社会生产生活方式,深度渗透到千行百业,推动产业的数字化转型,并融入社会活动中,推动了生活方式的数字化变迁。人工智能时代的科技和经济竞争,在一定程度上取决于算力市场的竞争,主要国家纷纷将算力市场培育成智能时代提升国家竞争力的重要抓手。因此,本文主要基于算力市场中下游环节,分析中国算力市场发展的现实,在人工智能时代背景下剖析算力市场发展的内在逻辑,并针对中国算力市场发展存在的现实问题提出相关的政策建议。
二、中国算力市场发展的现实图景
改革开放以来,中国主动融入全球化进程,抓住了互联网、移动互联网、人工智能等一系列数字革命的发展浪潮,为算力市场的发展打下了坚实的技术、终端、数据、用户、平台等的基础。总体来看,中国算力基础设施部署领先、算力市场规模快速增长、云服务企业快速涌现、算力需求场景不断拓展、技术进步加速,为人工智能时代的高质量发展和构建竞争优势创造了现实条件。但同时也要看到,我国算力基础设施的利用效能、算力市场的内部结构、企业的全球竞争力、算力的商业价值实现等面临现实困难,且在美国的极限打压下,产业安全和国家安全面临严峻挑战。
(一)算力基础设施建设领先,但利用效能有待提升
网络、存储和计算是构成智能社会万物互联、数据上云、智能计算的三大体系,共同构筑了算力基础设施。近年来,随着数字革命和智能革命的加速推进,我国算力基础设施建设加速,网络基础设施、数据中心、智算超算中心快速发展。网络基础设施方面,我国已建成全球规模最大、技术领先的网络基础设施,截至2023年12月,互联网宽带接入端口数量达11.36亿个,光纤接入(FTTH/O)端口数量达到10.94亿个,具备千兆网络服务能力的10GPON端口数量达2302万个,光缆线路总长度达6432万千米,累计建成5G基站337.7万个,覆盖所有地级市城区、县城城区(中国互联网络信息中心,2024)。计算和存储基础设施方面,我国算力总规模位居全球第二,近5年年均增速近30%。截至2023年6月底,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到197百亿亿次/秒(EFLOPS),存力总规模超过1080艾字节(EB)。围绕算力枢纽节点建设130条干线光缆,数据传输性能大幅改善。2023年以来,随着通用大模型的快速崛起,智能算力快速增长。根据中国信息通信研究院统计数据显示,截至2023年6月,全国已投运的人工智能计算中心达25个,在建人工智能计算中心超20个(中国信息通信研究院,2023)。此外,超算基础设施商业化加速,超算从相对封闭的科学计算、政府、能源、电力、气象等应用领域转向云计算、机器学习、人工智能、大数据分析以及短视频等,超算与互联网技术的融合不断加速,超算互联网商业化探索加快推进。
与算力基础设施快速增长相对应的是,受技术、政策、商业等的影响,中国算力的总体使用效率尚存在如下几方面的突出问题。一是技术上长距离数据传输的低时延和高带宽迫切需要加快技术突破,在“东数西算”和超算中心算力的使用过程中面临严峻的技术挑战,算力的实际应用需要网络技术和能力的支撑。二是地方竞争导致数据中心表现出建设加速但应用不足的“现实矛盾”,中西部竞相加大算力投资,但由于当地的数字经济发展水平较低,新建的算力中心缺乏丰富的产业需求,导致其可能面临收入难以覆盖折旧和运营成本的现实问题。三是跨域调度和跨中心调度面临商业上的利益冲突和技术上的异质互联问题,异质架构的算力中心在集中化接入、一体化调度、流通交易等方面面临技术障碍的问题,导致分割在各地的算力中心未能有效连接;平台企业和运营商两类建设的算力中心存在融合技术路线困难,平台企业基于交易和存储的云服务算力中心,运营商基于网络和通信的网络算力中心,二者的互联互通受到技术线路的限制。
(二)算力市场发展迅速,但结构性问题依然突出
算力基础设施的运营高度市场化,存储和计算往往会一体化发展为云服务厂商,网络发展则由网络运营商推动,在不同国家和地区的云服务和网络服务中存在一体和分立的两种模式。然而,由于算力服务发展的非均衡性,网络运营商的主业可能会集中在基础的通信业务而非算力的通信业务,在整个算力市场中云服务成为业务核心。近年来,在数字经济发展驱动下,全球云服务市场快速发展。IDC的数据显示,2022年全球公共云服务(含SaaS、IaaS和PaaS)市场规模达到5458亿美元,同比增长22.9%(见图1),数倍于同期全球经济增速,且未来依然保持相对高位的增长态势。根据IDC预测,2023年全球公共云服务收入将达到6630亿美元,比2022年增长20.0%,预计2022—2027年的复合年增长率达到19.9%,到2027年全球公共云服务收入将达到1.34万亿美元。其中,美国将成为最大的公共云服务市场,预计2027年公共云服务收入将达到6970亿美元;西欧公共云服务收入将达到2730亿美元,为第二大市场;中国为第三大市场,公共云服务收入将达到1170亿美元,但复合年增长率为26.9%,仅次于拉丁美洲29.1%的复合年增长率(Shirer,2023))。
图1 2018年至2023年上半年全球公共云服务市场规模及其增速
资料来源:根据《IDC全球半年度公有云服务跟踪报告》整理。
从全球竞争结构来看,亚马逊、微软、谷歌是云服务的领导者,Synergy Research Group的数据显示,2023年第4季度,亚马逊云服务(AWS)在全球云基础设施服务中占据了31%的市场份额,微软所占市场份额为24%,谷歌云所占市场份额为11%,阿里巴巴云服务、Salesforce、IBM云服务、甲骨文、腾讯云分别占据全球市场份额的4%、3%、2%、2%和2%(Richter,2024),前三大厂商的市场集中度(CR3)达到66%,云服务市场表现出高度的寡头垄断态势。
从国内市场来看,根据IDC发布的《中国公有云服务市场(2023上半年)跟踪》报告,2023年上半年中国公有云服务整体市场规模(含SaaS、IaaS和PaaS)为190.10亿美元,较2022年同期增长了14.66%。从2018—2022年的总体市场规模增长情况来看,4年实现了4倍的增长,显现了中国云服务市场的巨大增长潜力(见图2)。从份额来看,2018—2023年中国公有云服务市场在全球市场中的占比从3.78%增长到6.03%,体现中国市场的快速成长,但与中国GDP(16.80%)和人口(17.72%)在全球的占比有很大的差距,公有云服务市场有待进一步发展。
图2 2018年至2023年上半年中国公有云服务市场规模及其增速
资料来源:根据IDC中国半年度公有云服务跟踪报告整理。
在快速发展的总体态势下,中国算力市场发展存在两方面的突出问题:一是公有云服务发展不足,难以发挥成本和规模优势。近年来,在各地加快政务云建设、央企数字化升级需求拉动,加之美国极限打压下中国主要的云计算企业难以获取芯片、存储器等,导致私有云、混合云企业增速超过大型云计算企业,这将在一定程度上影响我国公共云服务市场的成本和效率,有损我国算力企业的市场竞争力。二是智能算力增长受限,难以适应人工智能时代对算力的现实需要。自2023年ChatGPT开放以来,通用大模型引发了人工智能快速发展的浪潮,直接刺激了用于训练大模型的智能算力需求。但是,受美国出口管制影响,我国用于智能算力的GPU海外购买基本被中断,国产芯片在性能、功耗、生态上尚存在较大的差距,进一步影响我国智能算力的提升,进而可能会影响我国在人工智能时代的竞争优势。
(三)云服务企业快速涌现,但竞争力有待提升
云服务企业是算力市场的主要创新主体和经济主体,其竞争力决定了一国(地区)的算力竞争力。在我国互联网、电子商务、移动通信快速发展的进程中,各类平台企业和运营商开始进入云服务市场,例如阿里云、腾讯云、华为云、中国电信、中国移动、中国联通等,形成了以“平台企业+运营商”为主导的市场结构。此外,近年来随着短视频、智能驾驶等行业的快速发展,一些行业领先企业,例如字节跳动、百度云、滴滴自动驾驶等也兴建智算中心,成为云服务市场的新进入者。IDC发布的《中国公有云服务市场(2023上半年)跟踪》报告显示,2023年上半年中国公有云服务整体市场规模(含SaaS、IaaS和PaaS)为190.1亿美元。其中IaaS市场规模为112.9亿美元,同比增速为13.2%,阿里云、华为云、中国电信、腾讯云和亚马逊云为市场排名前五,市场份额总和为72.4%;PaaS市场规模为32.9亿美元,同比增速为26.3%,阿里云、腾讯云、亚马逊云、华为云和中国电信为市场排名前五,市场份额总和66.9%,市场集中度低于IaaS市场(见表1)。
资料来源:根据《中国公有云服务市场(2023上半年)跟踪》整理。
尽管阿里云、腾讯云、华为云、中国电信在中国云市场中占据主导地位,但从规模来看,中国企业与全球领先的云服务企业相比,其收入有数十倍的差距(见图3),且主要收入来源于国内市场而非全球市场,中国云服务企业的全球竞争力有待进一步提升。
图3 2023年全球主要云服务厂商销售收入及其增速
资料来源:根据各公司披露的年报信息整理。
比较来看,全球算力市场为美国企业所主导,中国云服务企业总体规模相对较小,且表现出网络运营商和云服务商分离发展和直接竞争的特征。平台企业和运营商两类主体建设的算力中心融合面临技术限制,前者基于交易、存储的云服务算力中心建设,而后者基于网络、通信的网络算力中心建设,两类算力中心互联互通面临底层的运营逻辑限制,导致算力资源浪费严重。此外,尽管也涌现出在短视频、智能驾驶等领域的专业云服务企业,但云服务市场在垂直领域的服务商发展相对迟缓。与之形成鲜明对照的是,美国除了通用的公有云服务厂商,其在细分行业也涌现出大量的云服务商,例如MindBody为全美各地的瑜伽工作室和沙龙提供服务,ProCore专注建筑行业云服务、Toast专注餐厅云服务、Brightwheel专注教育行业云服务、Houzz专注家居改造和设计云服务,我国在软件服务方面的垂直行业领域发展不成熟,专攻细分行业的云服务商有待进一步发展。
(四)算力需求场景不断拓展,但商业价值实现有待进一步强化
从成熟的数据存储、云计算、科学计算、大数据分析,到当前快速兴起的人工智能和机器学习、自动驾驶、区块链和加密货币,算力的需求场景不断拓展,也成为牵引算力市场不断发展的内在驱动力量。然而,从现有算力市场的实际情况来看,存在用户对算力认知不足、地方政府和大型企业重建轻用、算力发展的数据开放壁垒、算力市场的治理问题突出等现实困难,具体表现在如下4方面。
一是对算力作为新质生产力核心动力的认识不足,缺乏使用的积极性。从现实的调研来看,很多中小企业对算力的认识尚存在较多误区,例如“认为算力就是数据储存”“算力只对高科技企业有用”“算力使用需要企业具有很强的技术能力”等,这也导致当前我国的算力客户主要集中在大型平台企业和初创的科技企业,海量传统企业和中小企业对算力的使用缺乏积极性。
二是地方和大型企业重建轻用,整体算力成本和效率缺乏竞争力。用户使用算力的直接表现就是购买服务,算力的实现过程对用户来说是“黑箱”,对一些有算力需求的企业来说,自建数据中心、算力中心往往也会成为其自然选择,加之认识的误区,一些地方政府和国有企业更偏好于可显现投资规模的有形资产建设,形成大量分散化和实际运营效果较差的私有数据中心、算力中心等,其运营效率较低。从数据来看,我国在用数据中心整体上架率仅为50%左右,而当前北美一级市场数据中心的空置率已降至4.4%。
三是受数据隔离和区域分割的影响,算力效能难以得到有效发挥。不同行业和部门间的数据难以开放共享,重点领域算力应用的标准化体系并不完善,数据采集、清洗、挖掘等服务环节难以深入推进。另外,地方政府为服务本地经济和抢占竞争高地,主观上并不愿意对算力开放和共享,导致算力资源出现“地区分割”和“域内封闭”。
四是“场景缺乏”和治理机制限制,算力中心的价值实现面临风险。政务场景、工业场景,以及更深层次的消费场景、科研场景等数据应用有待进一步挖掘,在业务不饱和时数据中心面临收入难以覆盖折旧和运营成本的现实困境。算力算网资源感知、度量、编排和路由等关键技术的突破和标准化尚处于起步阶段,算力交易的落地尚缺乏有效的治理模式,算力大市场的价值创造功能尚未能发挥。此外,各地近年来加速清理利用“矿机”挖矿的行为,导致大量算力设施闲置,算力中心难以开发新的商业模式实现商业价值以推动产品和能力的持续升级。
(五)技术进步加速,但在美国极限打压下面临严峻的安全风险
算力市场是一个高度复杂的系统,不仅包括底层的传感、传输、存储、计算、电源管理等各类芯片,以及具象化的服务器、机房、网络等,还包括用于形成指令的操作系统,以及存储和执行运算的数据库等。总体来看,我国算力市场已形成较大规模,具有完整的生态体系,整体技术水平快速进步。截至2023年底,全国在用数据中心机架总规模超过810万标准机架,算力总规模达到230EFLOPS,位居世界第二。我国服务器出货量位居世界前列,但服务器内的核心元器件,例如CPU、GPU、存储器等主要来源于美国和韩国企业。支撑算力的芯片尤其是高端芯片主要依赖美国厂商,英特尔、AMD和英伟达占据我国85%以上的服务器芯片市场,高性能芯片供给严重不足。此外,数据中心的核心硬件、操作系统、技术标准等存在突出的“卡脖子”问题,数据中心的自主化率较低。
尤其是近年来美国对我国人工智能、集成电路等高科技领域实施极限打压行动,我国算力市场面临严峻的“卡脖子”风险。自2018年4月16日“封杀”中兴至今,美国通过“罗织”清单、国家“立法”、联合盟友等多种方式对我国集成电路、人工智能产业实施精准狙击和全面打击。尤其是2022年8月修订的《出口管制条例》(Export Administration Regulations,EAR),美国对大算力芯片对华出口实施了极为严格的管制措施,并通过“美国人”(U.S.Persons)条款禁止美国与我国集成电路技术的任何交流,我国获取世界领先芯片的市场化道路被“堵死”。与此同时,尽管国内有华为、寒武纪、壁仞科技等大算力芯片领先企业,但在制程、算力、能耗等方面均落后于英伟达、AMD等头部企业,且高端芯片制造在美国的精准打击下自我保障风险较高,短期内提高我国算力能力面临极大困难,从长期来看,美国会进一步加大对我国人工智能产业的全方面遏制力度。
三、算力市场发展的三重逻辑:技术、市场和国家
从全球算力市场发展的趋势来看,从传统的数据存储到云计算,再到当前快速发展的智能算力,算力市场是技术驱动、市场牵引和国家竞争三方力量共同作用的结果(见图4)。一是技术驱动下数据获取、存储、计算、传输等具有更高的效率和更低的成本,数据孪生的经济性不断提升;二是市场牵引下的各类应用场景,对数据存储、计算、通信的需求,大量公共和私有的算力需求牵引了算力设施的建设和市场的发展;三是在国家竞争下政府对算力基础设施建设、市场主体培育、技术进步等全方位的支持,以算力市场竞争力来实现在人工智能时代的国家竞争力。
图4 算力市场发展的三重逻辑
(一)技术驱动的成本下降是算力市场形成和成长的基本前提
摩尔定律、网络经济、并行计算是算力市场发展的三大技术动力,其核心是驱动数据存储、云计算、数据互联的成本下降,形成与本地存储、本地计算的比较优势,也形成了算力网络对本地存储和计算的竞争优势。
摩尔定律驱动了各类芯片的成本下降和效率提升,不仅降低了边端产品的制造成本,也驱动了海量数据储存、计算和通信的硬件成本下降。1965年英特尔创始人之一戈登·摩尔预言“芯片中晶体管的数量每年会翻番,半导体的性能与容量将以指数式增长”,其成为集成电路行业进步的圭臬。尽管近年来随着芯片制造进入纳米制程,摩尔定律趋缓,但创新芯片设计和制造模式的“超越摩尔定律”(More than Moore,MtM)开始得到业界的认可。尽管难以实现24个月晶体管数量翻番的目标,但通过满足特定领域的应用,实现性能、功耗、成本的最优匹配在业界成为可能,例如苹果公司研发的M系列芯片将不同制程、不同类型芯片的异质封装和存算一体;英伟达的A100、H100和B200芯片实现了存算一体和高速互联芯片等的异质封装,并成为全球最具竞争力的人工智能芯片。在算力市场发展的过程中,摩尔定律驱动的成本下降尤其是单位算力的成本下降,使得算力产品具有经济上的基本可能性。
通信行业的发展遵循梅特卡夫定律的网络经济性,即更多的主体参与带来了正向的网络效应并实现了规模经济,海量数据的获取和传输成本极大下降甚至表现为“负成本”,数据的经济价值得以实现,也为大数据、云计算等经济价值实现创造了可能。1993年,乔治·吉尔德以计算机网络先驱罗伯特·梅特卡夫的姓氏命名的“梅特卡夫定律”的核心内涵是:一个网络的价值等于该网络内的节点数的平方,而且该网络的价值与联网用户数的平方成正比。随着互联网、移动互联网、物联网的发展,接入网络中的主体数量增加,网络中容纳的数据量呈现几何级增长,这使得网络的价值也呈现几何级增长,网络运营的收入可实现对建设成本的覆盖,使得云计算的商业化实现成为可能。
多任务的并行计算能力满足了多任务需求,使得云计算相对单机计算具有显著优势。从早期由共享同一内存资源CPU组成的并行计算,到向量处理器的诞生实现了对数值数据流的处理,以及超级计算机、大规模并行处理系统、超级计算机组成的集群计算,再到当前快速发展的GPU和多核处理器,使得云计算平台和分布式计算框架的发展成为可能,技术进步显著提升了计算效率和处理能力。人工智能时代以来,GPU等人工智能芯片的并行处理能力、使用处理复杂问题的算法和大规模数据集的优势、更高能效和处理速度,使数据的计算能力和能效得到有效体现,数据计算成本的下降促进了人工智能的快速涌现。
(二)市场需求涌现使算力市场的快速发展成为现实
技术使算力的商业化成为可能,但市场不断涌现的新需求则使算力市场成为现实的内驱力。运载力、存储力和计算力构成了现实的算力市场,早期的算力市场主要集中在存储力领域,5G商业化之后算力市场的运载力也得到显著改善,发展相对滞后的也就是计算力,其成为当前算力市场的核心内容。云计算作为计算力市场的直接产品形式,其发展和演化来源于市场需求的扩张。
尽管云计算这一概念可追溯到20世纪60年代约翰·麦卡锡提出的“公共计算机实用服务”观念,但受到当时计算能力和通信技术的限制,直到互联网商业化和公众接入的20世纪90年代末,云计算才开始商业化运营。例如,1999年Salesforce成立并推出了基于互联网的企业软件,这被视为云计算商业化的开端,而亚马逊在2002年推出的亚马逊网络服务(AWS)则标志着现代云计算的开始。但真正意义上的云计算则是在搜索引擎、电子商务快速崛起后,互联网平台企业开放其冗余的存储、计算和通信资源大力发展云计算业务,例如谷歌、微软、阿里巴巴、腾讯等分别推出其云服务业务,并成长为当前全球主要的云计算服务商,成为中小企业和个人用户最主要的云计算供应商。近年来,为满足大型组织、中小企业和个人的多元化需求,私有云和混合云快速发展,实现了成本、效率、安全的需求和供给的综合平衡。而随着边缘计算、人工智能、物联网、5G等新技术的融合和发展,更加智能和分布式的计算需求成为主导需求,例如大模型训练、智能驾驶、智能制造、智能家居等多元化需求需要新的云计算服务方式。
(三)政府支持下的算力基础设施和产业快速推进
人工智能时代下,“算力即权力”,算力基础设施建设和产业成长也就成为各国构建新竞争优势的必然选择。从算力与经济发展的关系来看,根据IDC的《2021—2022全球计算力指数评估报告》,从美国、中国等15个重点国家数字经济发展情况来看,算力指数(根据计算能力、计算效率、应用水平、基础设施等指标测算)平均每提高1个点,国家数字经济和GDP将分别增长3.5‰和1.8‰。为此,各国都强化对算力基础设施及产业发展的相关支持。
美国通过出台《芯片与科学法案》(CHIPS and ScienceAct)以提升其在量子计算、人工智能等多个领域的研发能力和技术领先优势,出台《两党基础设施法案》(Bipartisan Infrastructure Law)扩大对美国数字基础设施的重大投资,例如改善宽带接入和完善网络安全架构,2023年进一步修订《国家人工智能研发战略计划》(National Artificial Intelligence Research and Development Strategic Plan)提出对基础和负责任的人工智能研究进行长期投资等9项战略目标任务。欧洲侧重于数字自主权和开源技术发展的支持政策,例如在开源软件(OSS)和开源硬件(OSH)上进行重大投资以提高成员国的技术独立性和创新能力;《2023—2024年数字欧洲工作计划》(Digital Europe Programme-Work Programme for 2023-2024)提出投入1.13亿欧元提升数据与计算能力。日本提出“社会5.0”的倡议,将网络物理系统与社会需求进行整合以创建一个超智能社会,并通过其政府和工业战略在人工智能、机器人技术和物联网等广泛技术领域进行投资以保持技术竞争优势,其中《半导体、数字产业战略》(「半導体·デジタル産業戦略」)将提高数据中心算力水平作为重要内容。中国出台《全国一体化大数据中心协同创新体系算力枢纽实施方案》《算力基础设施高质量发展行动计划》《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》等相关政策,并提出到2025年的发展量化指标,推动算力基础设施建设中的能源优化利用,并支持西部地区在数字经济时代率先发展。各国竞相强化在算力领域的基础设施建设,加大创新投资,体现了算力在未来全球竞争力中的重要地位。
四、人工智能时代中国算力市场高质量发展的政策建议
技术、市场和政府驱动人工智能时代算力市场发展的逻辑,客观上要求充分重视算力市场发展的现实困境,发挥有为政府和有效市场作用,提升基础设施建设和协同效能,创造更多发展场景,并加大对算力市场中核心云服务企业的培育,立足新竞争形势强化底层技术突破和国产替代,以高质量的算力市场建设构筑中国在人工智能时代的竞争优势。
(一)超前部署算力基础设施,以算网云协同提升算力设施效能
要实现在人工智能时代的领先优势,需要前瞻性部署算力基础设施以为数字创新提供载体和平台,并加快推进算网云协同实现对算力基础设施的高效利用。
一是适度超前布局,加快数字智能基础设施建设。深入推进“东数西算”工程,加快“八大枢纽、十大集群”的集约化建设,打造异质架构芯片的存力和算力集群,形成能够支持人工智能时代经济社会发展的基础存力和算力资源。构建“大算力集群+小算力中心”互联互通的算力网络,通过创建算网城市、打造算力中心标杆等方式形成示范效应,促进各地算力设施的高质量建设。按照云服务模式升级国家主干网,形成主干网与算力中心直联互通的新型接入模式,加快光纤网络扩容提速、5G商用部署和规模应用,探索高速互联技术的突破和商业化应用,破解运载力的“堵点”“卡点”。加快基础设施的数字化、智能化改造,加速各类园区的数字化,智能化改造,降低企业应用数字基础设施的成本。充分发挥财政资金前期建设的保障性作用和后期建设的引导性作用,带动更多市场主体共同参与数字基础设施建设,尤其是重点支持公有云和公共智算中心建设,形成共性、泛在的算力供应。既要发挥国资背景的运营商和地方政府的资源调度优势,又要发挥阿里巴巴、百度、华为、腾讯、京东等互联网平台公司丰富的产业对接经验及研发运营优势,将算力赋能给产业的效率最大化,真正地促进新质生产力提升。
二是强化算网云协同,提升有限供给下的算力效能。成立国家级网云调度平台,协调网络运营商、云服务商、集成电路设计龙头企业、云操作系统商、数据库服务企业等组建算力中心联盟。以云调度平台为载体,构建算力数据交易与结算中心,推动算力市场有序协调发展。鼓励地方政府打通数据共享关卡,整合区域资源,打造面向全国市场、具有地方特色的算力服务体系,避免因供需不匹配造成的低效利用甚至资源浪费问题。整合区域内闲置算力资源,建立一体化的算力资源池,再利用招商引资渠道面向域外提供算力资源清单。
三是加快算力标准化建设,打造数据要素全国统一大市场。在加快建设全国统一大市场的背景下,要高度重视数据要素的统一大市场建设。按照标准接入、算能平衡、异质柔性的要求制定数据中心标准,指导各类算力中心加速标准化建设。推动算力联通网络标准从国内标准走向国际标准,促进算力网络的全球互联互通,打造互信互利、包容创新、合作共赢的全球算力网络共同体。
(二)加速推动算力场景开发,创新人工智能发展的新技术路线
技术革命推动产业变革,需要技术不断应用、融入和改造现有产业,并拓展产业的发展场景,形成“技术+产业”互动的正向上升循环。在人工智能时代全球竞争的背景下,加速算力场景的开发并推动产业发展成为获取竞争优势的必然选择,尤其是在OpenAI生成式大模型和英伟达GPU芯片优势地位强化的竞争态势下,需要进一步利用场景优势来探索人工智能产业和算力的新技术路线以构建新优势。
一是深化需求牵引,加强算力应用场景的创新和开放。重点围绕政务、工业、服务业数字化转型和智能化升级需要,加快多样化应用场景落地推广,打造重点领域算力应用标杆,形成交互、共性、开放的标准体系,推进对千行百业的云计算应用赋能。激励算力创新企业发展,鼓励利用公共算力和专业算力资源以及生成式大模型平台开发算力产品,推动“算力+医疗”“算力+教育”“算力+研究”“算力+能源”“算力+交通”等各类算力产品开发,真正落实“人工智能+”战略。落实对新经济、新模式、新技术的包容审慎监管政策,充分激发云网平台各市场主体的创业积极性,丰富云计算的多元化应用场景,同时也为集成电路产业的有序突破和赶超创造需求场景。
二是激励用户上云,牵引算力市场发展。探索云服务采购模式创新,鼓励政府和国有企业加大公有云采购力度,推动敏感数据与脱敏数据的混合云建设,以政务需求和大型企业需求牵引公共算力市场发展。创新中小企业上云政策,鼓励云平台企业加快发展低代码平台,推广SaaS这一易用性产品,以“算力券”等多种方式激励中小企业用云、上云,以“长尾需求”牵引算力市场发展。
三是强化技术路线创新,构筑人工智能时代的竞争新优势。ChatGPT彰显了通用大模型的巨大生产力,也成为美国以“AGI+GPU”构筑护城河的依托,但人工智能的新技术路线依然存在。建议结合我国在电子商务、制造业、交通运输、汽车、零售等领域的优势,以通用“大模型+垂直大模型”相结合,打造人工智能领域的非对称竞争优势。此外,在硬件进步难以赶超美国的背景下,探索从应用端出发,形成应用牵引的芯片、网络、系统协同创新发展模式,推动算力网络的系统式重构。
(三)加速云服务企业全球化发展,繁荣算力市场发展生态
从全球竞争态势来看,我国的云服务企业总体规模偏小、竞争力较弱、细分领域企业较少,这成为我国算力市场全球竞争力的重要“掣肘”。为此,要从供给侧加速全球化的云服务企业培育,加快云服务企业的全球化发展,并支持细分市场云服务企业发展,构建繁荣的算力市场生态。
一是支持云服务企业算力能力建设,避免在中美竞争情境下的“算力挤出”。在美国等西方国家对我国人工智能、集成电路等产业极限打压的背景下,需要进一步强化与美方沟通尤其是与各类企业沟通,进一步畅通包括GPU在内的各类算力芯片的采购渠道;积极组织国内芯片设计、制造企业与算力企业等的协同合作,加快芯片的自研和应用,满足市场和技术快速变化背景下的算力建设需要。推动不同所有制性质、不同行业、不同投资者共建开放式的算力中心,避免竞争采购造成的算力成本上升和恶性竞争问题。
二是支持云计算企业的全球化拓展,推动云服务企业与大型国有企业等“携手行动”。支持云计算企业的全球投资和业务拓展,对其海外并购开设“绿色通道”,组织相关研究机构或者行业联网加大海外市场研究,拓展云服务企业的海外市场。鼓励与有海外投资的大型国有企业“协同出海”,利用业务优势和技术优势加大力度拓展共建“一带一路”国家和地区的云服务市场。
三是注重全球化发展中的本地化发展,以数据信任和有效服务来树立全球化品牌。由于数据的隐私和安全特征,使得各国都对数据出境保持高度敏感。为此,在云计算企业海外经营过程中,要强化数据中心的本地化建设和本地化运营,严格遵守所在国家和地区的相关法律规定,构建可信任的数据运营服务商。政府和行业相关部门为企业海外经营做好合规支持,聘请精通法律和本地化运营的专家来辅导相关企业的海外经营。
四是支持细分领域的算力企业发展,繁荣算力市场生态。支持算力市场围绕细分领域、具体行业的企业创新,鼓励算力企业聚焦生物科技、材料化学、金融科技、智能制造等细分行业提供定制化的算力解决方案,结合细分市场特征开发新算法、优化计算架构或提高能效性能以提供更高效、更经济的服务。例如,大力开发低能耗的数据中心和算力解决方案以支持高耗能行业的绿色化转型,对有高敏感数据的行业(如医疗健康和金融服务)提供更加安全的算力服务。
(四)强化底层技术突破和国产替代,夯实算力安全的技术根基
长期来看,要实现算力市场的高质量发展,核心是强化底层的技术控制力,为人工智能时代的全球竞争奠定坚实的技术根基。
一是强化算力系统底层技术创新和突破,构建安全可控的算力云体系。鼓励云服务企业联合高校科研院所等,加快推动虚拟化技术、分布式技术、数据管理技术、超带宽通信技术、云安全技术等底层技术的开发,探索与现有技术路线适配的自主化技术路线,并推动新技术路线的标准化和通用化发展,真正化解云计算产业的“卡脖子”风险。鼓励企业和研究机构增加在算力技术,尤其是芯片设计和制造技术方面的研发投入。
二是聚焦算力系统的重点技术优先突破。加快推进异质架构算力互联互通技术的优先突破,首先解决异质架构芯片算力低损条件下的互联互通问题,探索算力池的技术实现模式,实现不同芯片、机架、数据中心在技术异质背景下的数据同质目标。加快推进超高速网络传输技术的优先突破,围绕EB级数据传输需要,由运营商牵头,联合高校科研院所、数据中心、标准化组织等,加快超高速数据传输技术的研究与突破。进一步推动大算力芯片的全产业链突破,把握算力快速增长的需求,牵引大算力芯片前瞻性部署安全架构和提升制造产能,带动集成电路全产业链突破。
三是探索关键核心技术攻关的协同推进。发挥新型举国体制和超大规模市场优势,根据算力快速增长的需求,加强大算力芯片前瞻性部署,带动集成电路全产业链突破。加快推进异质架构算力互联互通技术的优先突破,探索算力池的技术实现模式,实现不同芯片、机架(柜)、数据中心在技术异质背景下的数据同质目标。围绕数据传输需要,加快推进超高速网络传输技术的优先突破。
(五)深化安全和绿色发展理念,支撑中国经济的更高质量发展
算力是中国人工智能时代高质量发展的基础,在中美竞争和全球生态危机的严峻形势下,需要高度关注算力系统的安全和绿色发展,为经济高质量发展提供安全支撑和绿色保障。
一是强化算力市场的系统安全。算力系统是海量芯片高速互联形成的算力集群,其不仅面临传统设备级系统所面临的硬件故障、软件漏洞、网络攻击等风险,还面临系统级、中心级、集群级的新风险,例如数据安全和隐私泄露、能源价格波动导致的成本风险、不稳定的水电供应和对设施的物理破坏导致的集群宕机等多种新的风险。为此,需要在传统的风险管理措施之上关注系统级风险和集群级风险。强化物理安全保障,提升算力集群应对自然灾害和人为破坏的水平;实施数据备份和灾难恢复计划,确保用户数据安全;构建冗余的电源、网络连接和冷却系统,保证系统在面临组件失败时的正常运行;以多层次的防火墙、入侵检测系统和数据加密技术,保护系统免受外部攻击和内部威胁;提高系统的能源使用水平,例如使用先进液冷系统和服务器以降低能源成本并减少环境影响。
二是推动算力中心的绿色低碳发展。绿色低碳化不仅是响应环保需求的必然之举,也是算力中心降低运营成本的现实选择。为此,在算力市场高质量发展的要求下,需要通过各种技术和管理策略实现能源使用的优化和碳排放的减少。进一步提升算力中心的能源利用效率,例如采用更高效的服务器和存储设备,优化数据中心的空调冷却系统(如采用自然冷却技术),改进电源管理系统等;加大能源使用中对可再生能源的使用,使用风能、太阳能或水能等可再生能源来支持数据中心的绿色运营,开发热能回收和再利用系统来减少能源浪费。