Part1 政策动态
北京:《北京市关于支持信息软件企业加强人工智能应用服务能力行动方案(2025年)》
4月8日,北京市经济和信息化局印发《北京市关于支持信息软件企业加强人工智能应用服务能力行动方案(2025年)》,提出支持MaaS企业在京集聚发展、推动信息软件企业发展行业模型能力、支持通用智能体发展、实施信息软件企业智能技改工程、提升数据治理能力、加速构建开源生态新体系、提升面向中小企业的人工智能服务能力、加强人工智能应用能力培训等具体内容。
Part2 市场篇
IDC:2028年中国人工智能总投资规模将突破1,000亿美元,五年复合增长率达35.2%
4月7日,国际数据公司(IDC)发布了2025年V1版IDC《全球人工智能和生成式人工智能支出指南》(IDC Worldwide AI and Generative AI Spending Guide)。报告数据显示,2024年全球人工智能(AI)IT总投资规模为3,158亿美元,预计到2028年将增长至8159亿美元,五年复合增长率(CAGR)为32.9%。在各类人工智能技术中,生成式AI表现尤为突出,其全球市场五年复合增长率有望达到63.8%,到2028年市场规模预计将突破2842亿美元,占全球AI市场投资总规模的35%。
从中国市场来看,中国在亚太地区的人工智能市场中继续保持领先地位,2024年其支出占比超过亚太地区人工智能总支出的一半以上。预计到2028年,中国人工智能总投资规模将超过1000亿美元,五年复合增长率为35.2%。其中,生成式AI在中国AI市场的投资比例也将逐步提升,2024年其占比为18.9%,而到2028年这一比例将达到30.6%,投资规模超过300亿美元,五年复合增长率达到51.5%。
从行业分布来看,软件和信息服务、通信以及银行业是人工智能投资最为集中的三大领域。到2028年,这三个行业的投资占比分别为49.8%、7.4%和5.8%。在软件与信息服务行业中,人工智能能够帮助企业优化业务流程,通过自动化开发、提供个性化服务等手段提升竞争力,并利用丰富的数据训练模型,推动新产品和服务的诞生。在通信领域,生成式AI可以优化网络规划与管理,从而提升客户服务质量。而在金融行业,生成式AI则可协助进行风险评估,为客户提供个性化的财富管理建议,进一步增强金融服务的能力与效率。
IDC:中国液冷服务器市场加速扩张,头部聚势驱动应用深化
4月8日,国际数据公司(IDC)发布《中国半年度液冷服务器市场(2024下半年)跟踪》报告。IDC数据显示,中国液冷服务器市场在2024年继续保持快速增长,市场规模达到23.7亿美元,与2023年相比增长67.0%。其中,冷板式解决方案市场占有率进一步提高。IDC预计,2024-2029年,中国液冷服务器市场年复合增长率将达到46.8%,2029年市场规模将达到162亿美元。
Part3 芯片产业链篇
消息称三星启动1nm 工艺研发:2029 年后量产
4月9日消息,三星电子半导体研究所于近日正式着手研发1.0nm工艺,部分曾参与2nm等尖端制程的研发人员被抽调,组建了专项项目团队。据报道,1nm工艺需要打破现有设计框架,引入新技术概念,以及引入高数值孔径极紫外(High-NA EUV)曝光设备等下一代设备。三星预计,量产时间将在2029 年之后。目前,在三星公开的晶圆代工工艺路线图中,计划于2027年量产的1.4nm工艺为目前最尖端的工艺。
谷歌发布第七代TPU芯片Ironwood
4月10日,谷歌发布第七代TPU——Ironwood,它是谷歌迄今为止性能最强、可扩展性最高的定制AI加速器,也是首款专为推理设计的加速器。Ironwood 搭载了高达192GB的显存,在带宽方面提升到至7.2Tbps,双向带宽也增加到1.2Tbps,让数据、芯片之间的传输速度更快,提升大规模分布式训练和推理的效率。Ironwood 最高规格「9216 版本」算力总计可达到42.5Exaflop(每个独立芯片峰值算力为 4614 TFLOPs)。
【拓展延伸】
TPU芯片对比分析
| TPU v5e | TPU v5p | TPU v6e | TPU v7e |
BF16 Compute | 197 TFLOPs | 459 TFLOPs | 918 TFLOPs | 2.3T PFLOPs |
INT8/FP8 Compute | 394 TOPs/TFLOPs | 918 TOPs/TFLOPs | 1836 TOPs/TFLOPs | 4614 TOPs/TFLOPs |
HBM Bandwidth | 0.8TB/s | 2.8TB/s | 1.6TB/s | 7.4TB/s |
HBM capacity | 16GB | 95GB | 32GB | 192GB |
Inter chip Interconnect Bandwidth(per link) | 400 Gbps | 800 Gbps | 800 Gbps | 1200 Gbps |
Interconnect Topology | 2D Torus | 3D Torus | 2D Torus | 3D Torus |
TPU pod size | 256 | 8960 | 256 | 9216 |
Spare cores | No | No | Yes | Yes |
***TPU版本中,“e”系列主要是专注于效率与推理,运行预训练模型;“p”系列专注于训练大型模型的原始性能。
华为最强大AI芯片910D曝光,首批样本5月到货,对标NVIDIA H100
据《华尔街日报》援引知情人士消息,华为准备测试旗下最新、最强大的AI 芯片昇腾(Ascend)910D,性能将超越NVIDIA H100。据悉,华为最快5月就能取得910D首批样本。预计,今年华为昇腾910B及910C的出货量将超过800000颗,客户包括中国电信运营商和民营AI开发商(例如字节跳动)。
【拓展延伸】
华为昇腾系列芯片对比分析
| Ascend 910B | Ascend 910C | Ascend 910D |
制程工艺 | 7nm | 7nm | 7nm |
显存 | HBM2e | HBM2e | HBM3e |
显存大小 | 34 GB | 64GB |
|
显存带宽 | 1.2TB/s | 3.2TB/s | 4TB/s |
INT8算力 | - |
|
|
FP16算力 | 376TFLOPS | 781TFLOPS | 1200TFLOPS |
FP32算力 | 128TFLOPS |
|
|
FP64算力 | - |
|
|
功耗 | 400W |
| 571W |
**由于华为官网并未披露相关性能指标,上述信息主要源自机构研报、公众号文章等
Part4 人工智能巨头最新动态
斥资7.2亿美元,Cassava携手英伟达打造非洲首座AI工厂
Cassava Technologies计划投资7.2亿美元,在非洲建立首个人工智能(AI)工厂。Cassava Technologies是由津巴布韦电信大亨Strive Masiyiwa创立的泛非洲科技公司,其计划将英伟达加速计算和AI软件部署到南非、埃及、尼日利亚、肯尼亚和摩洛哥。南非将成为非洲首个使用英伟达AI数据中心的国家。
中国移动:未来将在算力网络的基础上进一步强化云智算
4月10日,中国移动董事长杨杰表示,中国移动将算网基础设施作为以科技创新引领产业创新的重点领域,创新提出“算力网络”原创性理念,并围绕“算力多元化、算网一体化、全域AI化”三个关键方向强化产业实践,推动算力成为一点接入、即取即用的社会级服务。
深化算力多元化布局,综合供给能力显著增强。一是通用算力泛在部署,优化“4+N+31+X”算力网络布局,拓展国家八大算力枢纽节点覆盖广度和深度,算力服务器规模超100万台。二是智能算力规模上量,建成13个全国性、区域性智算中心节点,打造多个超大规模智算中心,智算规模超43EFLOPS。三是多元算力汇聚融通,并网21家智算中心、3家国家级超算中心、3家量算中心,可调度算力资源占全国的六分之一。
加强算网一体化融合,供需匹配精度大幅提升。一是算网资源一体建设,率先完成国家八大枢纽400G大带宽、超高速网络直联,入选“2024年央企十大超级工程”。二是算网大脑规模商用,在京津冀、长三角等4个枢纽级、区域级算力节点落地,特别是在“长三角芜湖集群”,打造全国首个“四算合一”的国家枢纽算力调度平台。三是算网技术加速突破,牵头提出全调度以太网、全向智感互联等原创技术,异构计算架构、海量数据存储等关键技术攻关取得重要进展。
Part5 其他资讯
ChatGPT订阅用户突破 2000 万
OpenAI的 ChatGPT 付费订阅用户已突破 2000 万,推动公司年化收入达到约 50 亿美元。ChatGPT付费用户从 2024 年底的 1550 万增长至 2000 万,增幅约 30%。每周活跃用户达到 5 亿。月收入从 3.33 亿美元增长至 4.15 亿美元,年化收入达 50 亿美元。OpenAI完成 400 亿美元融资,投后估值达到 3000 亿美元,超越英特尔和 AMD 市值总和。
截至3月底,共有346款生成式人工智能服务完成备案
4月8日,网信中国发布生成式人工智能服务已备案信息的公告,截至2025年3月31日,共有346款生成式人工智能服务在国家网信办完成备案;对于通过API接口或其他方式直接调用已备案模型能力的生成式人工智能应用或功能,共有159款生成式人工智能应用或功能在地方网信办完成登记。
来源:每日AI动态追踪