新闻中心

实时更新中芯汇金最新动态,了解中芯汇金

产业动态 | 了解生成式人工智能对半导体行业的影响

发布时间 :2024-07-12 17:06:48

简介

随着 ChatGPT 和 Sora 等应用的广泛应用,生成式人工智能(gen AI)已风靡全球。但在这些令人印象深刻的功能背后,是对计算能力的巨大需求。这一浪潮将推动半导体行业进入一个新的发展和创新阶段。我们从麦肯锡在三月出版的报告中获得启发,解析其内容,探讨 Gen AI 如何塑造半导体的未来,研究需求场景、硬件趋势以及芯片制造商面临的挑战 [1]。


新一代人工智能计算需求格局

要了解 Gen AI 的影响,我们需要同时关注消费者(B2C)和企业(B2B)应用。麦肯锡的分析估计,到 2030 年,B2C 应用将占新一代人工智能计算需求的 70%,B2B 将占其余的 30%。


B2C 应用包括起草电子邮件等基本的消费者互动,以及根据文本创建视觉效果等更高级的任务。B2B 用例横跨各个行业和功能,从软件开发到客户参与。


B2B 用例原型

麦肯锡为基因人工智能确定了六种关键的 B2B 用例原型:

1. 编码和软件开发

2. 创意内容生成

3. 客户参与

4. 创新(如研发流程)

5. 简明扼要(总结结构化数据)

6. 复杂简明(总结非结构化或大型数据集)


这些原型是根据其价值创造潜力和服务成本定义的。让我们来看看它们是如何叠加的:


产业动态 | 了解生成式人工智能对半导体行业的影响(图1)


从图表中我们可以看出,预计到 2030 年,六种原型中有五种在经济上可行,可以广泛采用。复杂简洁 "原型面临挑战,因为相对于其价值创造潜力,它的计算要求较高。


需求情景

麦肯锡为基因人工智能的应用制定了三种情景:基础、保守和加速。这些情景考虑了技术进步、监管发展和用户接受度等因素。


在基础情景下,到 2030 年

l人工智能计算总需求可达到 25x10³⁰ FLOPs(浮点运算)
l70% 来自 B2C 应用,30% 来自 B2B 应用


产业动态 | 了解生成式人工智能对半导体行业的影响(图2)


B2C 需求驱动因素:

l使用人工智能技术的消费者数量
l参与程度(如日常互动)
l每次互动的计算需求

B2B 需求驱动因素:

l经济上可行的用例采用率
l价值实现时间表
l监管环境和技术进步


随着人工智能应用的普及,它们正在推动数据中心基础设施和服务器设计发生重大变化。


人工智能数据中心与传统数据中心的比较

关键区别在于功率密度:

l传统数据中心: 每个机架 5-15 千瓦
l人工智能训练工作负载: 每个机架高达 100-150 千瓦
l未来预测: 可能达到每个机架 250-300 kW


功率密度的增加要求从风冷系统转向液冷系统,包括直接到芯片和全浸入式冷却技术。


人工智能服务器的组件

为满足基因 AI 工作负载的需求,AI 服务器集成了多个专用组件:


产业动态 | 了解生成式人工智能对半导体行业的影响(图3)


1. 中央处理器

2. 图形处理器(GPU)

3. 人工智能加速器

4. DDR 内存(双倍数据速率内存)

5. HBM(高带宽内存)

6. NAND 存储器

7. 互联

8. 主板

9. 电源装置


服务器架构演变

我们看到服务器架构正在发生变化,以适应不断变化的人工智能工作负载的性质:


训练服务器:

l目前的主流架构:2 个 CPU + 8 个 GPU
l预计2030年仍将是训练工作负载的主流架构


推理服务器:

l向更专业的硬件过渡
l2030年,预计使用ASIC(特定应用集成电路)的CPU+AI加速器组合的使用将增加

产业动态 | 了解生成式人工智能对半导体行业的影响(图4)


本图表说明了服务器架构从 2024 年到 2030 年的预计转变,其中 CPU + AI 加速器配置将成为推理工作负载的主导。


新一代人工智能晶圆需求和半导体行业影响

新一代人工智能应用的激增正在推动各种芯片类型对半导体晶圆的空前需求。


逻辑芯片

  • 2030 年非新一代人工智能需求:约 1500 万个晶圆
  • 新一代人工智能的额外需求: 120-360 万片晶圆(≤3 纳米节点)
  • 潜在供应缺口:1-4 百万晶圆
  • 需要新建晶圆厂: 2030 年需要 3-9 座新晶圆厂


内存芯片

  • DRAM(DDR 和 HBM):
  • 轻型 DRAM "方案:500-1300 万片晶圆(4-12 座专用晶圆厂)
  • DRAM 基础 "方案:700-2100 万片晶圆(6-18 座专用晶圆厂)
  • NAND: 2,800 万晶圆(1-5 座专用晶圆厂)

产业动态 | 了解生成式人工智能对半导体行业的影响(图5)


该图全面展示了 2030 年的预计晶圆供需状况,突出显示了人工智能技术对逻辑和存储器细分市场的重大影响。


挑战与创新

满足这一爆炸性需求给半导体行业带来了多项挑战:

1. 存储器墙:随着人工智能模型越来越大,内存容量和带宽正成为系统级性能的瓶颈。

2. 算法效率:未来的算法可能需要提高内存效率,以缓解需求增长。

3. 新架构:业界正在探索新型芯片设计和系统级优化,以提高性能和效率。

4. 制造能力:为满足需求,有必要对新的晶圆厂和生产线进行大量投资。

5. 能耗:人工智能服务器的能耗极高,到 2030 年,其耗电量可能超过全球总耗电量的 10%。


为应对这些挑战,整个价值链都需要创新:

  • 算法设计: 开发降低计算和内存要求的新方法。
  • 芯片架构: 为人工智能工作负载创建专门设计。
  • 存储器技术: 提高密度并探索新的内存类型(如内存计算)。
  • 网络: 改进服务器和组件之间的高速互连。
  • 软件优化: 提高编译器和系统级效率。


结论

生成式人工智能的兴起代表着半导体行业的潜在拐点。它推动了对更强大、更高效、更专业的逻辑、内存和其他类别芯片的需求。要满足这一需求,就需要对制造能力进行大量投资,并在芯片设计和系统架构方面持续创新。


对于半导体行业的领导者来说,主要的启示有

1. 评估哪种需求情景(基本、保守或加速)符合您的市场前景。

2. 评估当前的产品组合,确定以人工智能为重点的芯片专业化领域。

3. 投资研发,应对内存墙和能效等关键挑战。

4. 考虑到新建晶圆厂的周期较长,制定产能扩张计划。

5. 与人工智能软件开发商合作,更好地了解不断变化的硬件需求。


通过领先于这些趋势并进行战略性投资,半导体公司可以定位自己,抓住人工智能革命的巨大价值创造潜力。未来几年将是塑造行业发展轨迹的关键时期,那些行动迅速、果断的公司很可能成为这个计算新时代的领导者。


参考文献

[1]Burkacky, M. Patel, K. Pototzky, D. Tang, R. Vrijen, and W. Zhu, "Generative AI: The next S-curve for the semiconductor industry?" McKinsey & Company, Mar. 麦肯锡公司,2024 年 3 月。


- END -


分享到微信朋友圈 ×

免费咨询

*姓名:
*手机:
邮箱:
区域:
您的问题:

感谢您的关注,您有任何问题都可以在此留下信息,中芯汇金会及时为您提供帮助。

提交