FPGA是什么？一篇入门介绍 – wiki基地

FPGA 入门：深入理解这块“可编程”的芯片

在当今数字世界的基石——半导体芯片的浩瀚宇宙中，我们常常听到 CPU（中央处理器）、GPU（图形处理器）、ASIC（专用集成电路）等名字。它们各自扮演着重要的角色，驱动着我们的电脑、手机、游戏机乃至工业设备。然而，还有一种同样重要、甚至在某些特定领域发挥着独特优势的芯片，它被称为 FPGA。

对于许多非专业人士或初学者来说，FPGA 听起来可能有些神秘或难以捉摸。它不像 CPU 那样直观地执行指令，也不像 GPU 那样专注于并行计算和图形渲染。那么，FPGA 究竟是什么？它有什么特别之处？为什么它能在各种高科技领域占据一席之地？

这篇文章将带你深入了解 FPGA 的世界，从它的基本概念、内部结构，到它的工作原理、优势与劣势，以及它在现实世界中的各种应用。我们将用尽量通俗易懂的语言，为你揭开 FPGA 的神秘面纱，为你打开通向这个“可编程”硬件世界的大门。

1. FPGA 是什么？—— 定义与全称解析

FPGA 的全称是 Field-Programmable Gate Array，直译过来就是 现场可编程门阵列。我们来拆解一下这个名字：

Field-Programmable（现场可编程）： 这是 FPGA 最核心的特点。它意味着这块芯片的功能不是在制造时就完全固定死的，而是在芯片被生产出来之后，用户可以在“现场”（也就是实际应用环境中或者开发环境中）通过配置来决定其内部电路连接和逻辑功能。这与大多数芯片（如 CPU、ASIC）在出厂时功能就已经固化不同。你可以多次更改 FPGA 的功能，就像给电脑安装不同的软件一样灵活（尽管原理完全不同）。
Gate Array（门阵列）： 这指的是 FPGA 内部的基本组成单元。数字电路是由逻辑门（如 AND 门、OR 门、NOT 门等）构成的。传统的门阵列芯片在制造时会预留大量的未连接的逻辑门，然后通过定制的金属层连接这些门来形成特定的电路功能。FPGA 借用了“门阵列”的概念，但它的“门”是“可配置”的，而且连接这些“门”的“线”也是“可编程”的。你可以想象它是一个由无数小乐高积木（逻辑门）和无数可以随意插拔的连接线组成的面板。

简单来说，FPGA 是一种集成了大量可配置逻辑单元和可编程互连资源的半导体芯片，用户可以通过硬件描述语言（HDL）对其进行编程，实现几乎任何所需的数字电路功能。它不像 CPU 那样顺序执行指令，而是通过配置内部的电路结构来并行执行任务。你可以把它看作一块空白的数字电路面包板，上面的元器件和连线都可以由你来定义。

2. 对比理解：FPGA 与 CPU、ASIC 有何不同？

为了更好地理解 FPGA 的独特性，我们将其与另外两种常见的芯片类型——CPU 和 ASIC 进行比较：

CPU (Central Processing Unit):
- 工作方式： CPU 是基于指令集架构的，它通过按照程序指令一条一条地顺序执行计算和控制任务。它的核心是控制单元和算术逻辑单元（ALU），功能非常通用。
- 灵活性： 极高。通过软件编程，CPU 可以执行几乎任何计算任务。更改功能只需要更改软件代码。
- 并行性： 有限。虽然现代 CPU 有多核，并且可以通过流水线、超线程等技术提高并行度，但本质上它仍然是顺序执行指令流，并行性是伪并行或任务级/数据级的有限并行。
- 性能/效率： 对于通用计算任务，CPU 非常强大。但对于特定的、需要大量并行处理且对时序要求极高的任务，CPU 的性能和效率（功耗）可能不如专用硬件。
- 制造： 功能在制造时固化，但可通过软件完全改变其行为。
ASIC (Application-Specific Integrated Circuit):
- 工作方式： ASIC 是为特定应用或功能专门设计和制造的集成电路。它的电路结构是完全定制的，在制造时就固定了。
- 灵活性： 极低。ASIC 的功能一旦制造完成就无法改变。如果设计有误或需求变化，需要重新设计和制造芯片，成本巨大。
- 并行性： 极高。ASIC 可以根据需求设计出高度并行的硬件结构，实现真正的并行处理。
- 性能/效率： 通常是最高的。由于是为特定任务量身定制，ASIC 在性能、功耗和单位成本（批量生产时）方面通常优于通用芯片和 FPGA。
- 制造： 功能在制造时完全固化。设计和制造周期长，前期投入（NRE – Non-Recurring Engineering Cost）非常高。
FPGA (Field-Programmable Gate Array):
- 工作方式： FPGA 通过加载配置文件（Bitstream）来配置其内部的逻辑单元和互连资源，从而实现特定的数字电路功能。它不是执行指令，而是构建硬件电路。
- 灵活性： 高。可以在开发阶段或产品部署后多次重新编程，改变其硬件功能。比 CPU 的灵活性低（不能像软件那样随意），但比 ASIC 高得多。
- 并行性： 很高。用户可以设计并行的硬件模块，在芯片内部同时运行多个独立的操作。可以实现更接近 ASIC 的真并行。
- 性能/效率： 介于 CPU 和 ASIC 之间。比 CPU 快（对于适合硬件并行处理的任务），比 ASIC 慢（通常频率较低，功耗较高）。
- 制造： 芯片硬件结构通用，功能通过用户配置实现。

总结一下它们的关系：

CPU 像一位通用工程师，什么都能做，但对于高度专业化的任务可能效率不高。
ASIC 像一台为特定任务量身定制的超级专用机器，效率最高，但只能做一件事。
FPGA 像一块可以根据需求快速搭建和拆卸的“乐高积木板”，可以快速搭建出多种专用机器，虽然不如 ASlC 那么极致，但比 CPU 专业，且可随时变换形态。

选择哪种芯片取决于具体需求：需要极致的灵活性和通用性，选 CPU；需要极致的性能、效率和最低的批量成本，且功能固定，选 ASIC；需要在性能、灵活性和开发周期之间取得平衡，或者需要现场可重配置，选 FPGA。

3. FPGA 的内部结构—— 探索“可编程”的奥秘

要理解 FPGA 如何实现可编程性，需要了解其内部的主要组成部分。尽管不同厂商、不同型号的 FPGA 结构有所差异，但核心组件是类似的：

可配置逻辑块 (Configurable Logic Block, CLB):
- 这是 FPGA 的核心计算单元。每个 CLB 都可以配置成实现不同的逻辑功能，如基本的逻辑门（AND, OR, NOT, XOR 等）、加法器、乘法器、选择器等。
- 查找表 (Lookup Table, LUT): CLB 中的关键部分是 LUT。你可以把 LUT 理解为一个小的内存，它的输入是地址线，输出是存储在该地址的数据。通过将真值表（描述输入与输出关系的表格）预先加载到 LUT 中，LUT 就可以实现任何指定数量输入变量的组合逻辑功能。例如，一个 4 输入的 LUT 可以实现任何 4 个输入变量的组合逻辑功能。
- 触发器/锁存器 (Flip-flop/Latch): CLB 中还包含存储单元，通常是 D 触发器。这些触发器用于存储状态，实现时序逻辑功能，如寄存器、计数器、状态机等。
- 一个 CLB 通常包含一个或多个 LUT 和触发器，以及一些额外的多路选择器和进位链等资源，以提高实现算术逻辑功能的效率。
可编程布线资源 (Programmable Routing Resources):
- 这些是连接 CLB、I/O 块以及其他内部资源的“导线”和“开关”。
- 它们由大量的金属线段（短线、长线、全局线等）和位于线段交叉点的可编程开关构成。
- 通过配置这些开关的通断，可以将不同的逻辑块按照设计需求连接起来，形成完整的电路。这是实现“可编程”互连的关键。布线资源的质量和数量直接影响设计的性能和可实现性。
输入/输出块 (Input/Output Block, IOB):
- 这些块位于 FPGA 芯片的边缘，负责将芯片内部的逻辑信号与外部世界的信号（如引脚、其他芯片）进行连接和接口转换。
- IOB 可以配置为输入、输出或双向引脚，支持不同的电平标准（TTL, LVCMOS, LVDS 等），并提供一些额外的功能，如输入寄存、输出使能、上下拉电阻等。它们是 FPGA 与外部硬件通信的桥梁。
其他专用硬件资源 (Dedicated Hardware Resources):
- 现代 FPGA 不仅仅包含 CLB、布线和 IOB，为了提高性能和效率，它们还集成了许多专用的硬核模块：
  - 内嵌存储器块 (Block RAM): 提供大容量、高速的片上存储，用于数据缓冲、查找表、FIFO 等。
  - 数字信号处理块 (DSP Slices): 专为数字信号处理任务（如乘法、累加、滤波）优化的硬件单元，执行这些操作比使用通用逻辑单元高效得多。
  - 时钟管理单元 (Clock Management Tiles, CMT) 或锁相环/延迟锁相环 (PLL/DLL): 用于产生、分配和管理时钟信号，提供时钟倍频、分频、去抖动、相位偏移等功能，确保电路的稳定和同步。
  - 硬核处理器 (Hard Processor Cores): 一些高端 FPGA（被称为 SoC FPGA）集成了完整的微处理器系统（如 ARM Cortex-A 系列）。这使得 FPGA 可以同时运行软件和定制硬件，结合了处理器的灵活性和 FPGA 的硬件加速能力。
  - 高速收发器 (Transceivers): 支持高速串行通信接口，如 PCIe, Gigabit Ethernet, USB 3.0 等，是实现高性能数据传输的关键。

通过将这些可配置和专用的资源有机地组合起来，FPGA 能够实现从简单的逻辑门功能到复杂的处理器系统、高速通信接口和大规模并行计算等广泛的应用。

4. FPGA 是如何“编程”的？—— 设计流程详解

FPGA 的“编程”与软件编程有本质区别。它不是编写一条条指令让处理器去执行，而是描述你想要构建的硬件电路。这个过程被称为 FPGA 设计流程 或 硬件开发流程。主要步骤如下：

1. 设计输入 (Design Entry):
- 这是描述期望硬件功能的阶段。最常用和最主要的方式是使用 硬件描述语言 (Hardware Description Language, HDL)。
- 常用的 HDL 有 Verilog 和 VHDL。它们允许设计师用文本方式描述数字电路的行为和结构，包括逻辑门、寄存器、时序关系、模块之间的连接等。HDL 更像是电路图的文本化表示，它描述的是硬件并行性，而不是软件的顺序执行。
- 此外，也可以使用图形化输入方式（如原理图输入），或者基于模型的开发工具（如 MATLAB/Simulink 生成 HDL 代码）。但对于复杂设计，HDL 是主流。
2. 综合 (Synthesis):
- 这一步是将用 HDL 或其他方式描述的高层次设计转化为低层次的门级网表 (Gate-level Netlist)。
- 综合工具会分析 HDL 代码，理解其逻辑功能，然后将其映射到由基本逻辑门和触发器组成的等效电路上。
- 例如，一个 HDL 描述的加法器会被综合工具转化为由 AND 门、XOR 门等组成的组合逻辑电路。
- 综合工具还会进行一些优化，如减小电路面积、提高速度等。
- 这一步的结果是一个与特定 FPGA 器件无关的逻辑电路连接清单（网表）。
3. 实现 (Implementation):
- 这是将综合生成的门级网表映射到目标 FPGA 芯片内部具体物理资源的过程，包括：
  - 映射 (Mapping): 将网表中的逻辑门和触发器映射到 FPGA 芯片中的 CLB（具体是 LUT 和触发器）。
  - 布局 (Place): 决定网表中每个逻辑单元（映射到 CLB 等资源）在 FPGA 芯片上的物理位置。就像在面包板上决定每个芯片放在哪里一样。布局的目标是优化性能、面积和布线。
  - 布线 (Route): 根据网表中的连接关系，在 FPGA 芯片的可编程布线资源中找到连接不同逻辑单元的物理路径。就像用导线连接面包板上的芯片一样。布线是 FPGA 实现中最具挑战性的步骤之一，其结果直接影响电路的时延和工作频率。
4. 生成比特流 (Generate Bitstream):
- 实现步骤完成后，物理布局和布线信息就确定了。这一步是将这些信息转化为特定的二进制配置文件，称为比特流 (Bitstream)。
- 比特流文件包含了配置 FPGA 内部所有可配置开关和存储单元所需的所有信息。当 FPGA 芯片上电时，它就会读取并加载这个比特流，从而使其内部电路结构固化成设计者期望的功能。
5. 下载与配置 (Download and Configuration):
- 最后一步是将生成的比特流文件下载到目标 FPGA 器件中。
- FPGA 通常通过 JTAG 接口、SPI 接口或者从外部存储设备（如配置 PROM 或 SD 卡）读取比特流来完成配置。
- 配置完成后，FPGA 内部的电路就按照设计者的要求构建好了，可以开始执行任务了。

这个设计流程是一个迭代的过程。 在每一步之后，设计者都需要进行仿真（Simulate）和验证（Verify），检查设计是否符合预期功能和时序要求。如果在仿真或实际测试中发现问题，就需要回到前面的步骤修改 HDL 代码或调整设计约束，然后重新走一遍流程，直到设计满足所有要求。

5. 为什么选择 FPGA？—— 主要优势

了解了 FPGA 的工作原理和结构，我们来看看它相比其他方案有哪些独特的优势：

1. 硬件级并行性 (True Hardware Parallelism):
- 这是 FPGA 与 CPU 最本质的区别。CPU 通过在时间上快速切换（或多核同时执行不同任务）来实现并行“感觉”，但其内部指令执行仍是顺序或有限并行的。
- FPGA 则可以构建大量的独立电路块，它们在芯片内部同时运行，互不干扰（除非设计上依赖）。你可以设计上千个并行处理单元来处理数据，实现真正的硬件并行。这对于需要处理大量并发数据流或需要极低延迟的场景（如高速网络处理、实时信号处理）至关重要。
2. 高性能与低延迟 (High Performance and Low Latency):
- 由于可以为特定任务构建定制的并行硬件电路，FPGA 在执行这些任务时的速度可以远超通用处理器。
- 更重要的是，FPGA 实现的是固定的硬件逻辑，数据直接流过这些逻辑，没有操作系统中断、指令解析、内存访问等待等开销，因此可以实现极低的、确定性的处理延迟。这对于需要硬实时响应的系统（如工业控制、高频交易）非常重要。
3. 灵活性与可重配置性 (Flexibility and Reconfigurability):
- 这是 FPGA 名称中“Field-Programmable”的体现。与 ASIC 相比，FPGA 的功能可以在芯片制造后随时更改。
- 这使得它非常适合：
  - 原型验证 (Prototyping): 在投入巨大成本设计 ASIC 之前，可以使用 FPGA 来验证设计的正确性和性能。
  - 标准演进 (Evolving Standards): 随着通信协议、编码标准等的不断变化，FPGA 可以通过更新配置来适应新的标准，而不需要更换硬件。
  - 现场升级与维护 (Field Upgrades): 部署在现场的设备可以通过远程更新 FPGA 配置来修复 Bug 或增加新功能，减少召回或现场更换硬件的成本。
  - 多功能实现 (Multi-functionality): 同一块 FPGA 可以根据需要加载不同的配置，在不同时间实现完全不同的功能。
4. 更短的开发周期与较低的前期投入 (Shorter Development Cycle and Lower NRE):
- 与 ASIC 漫长的设计、流片（Chip Fabrication）和封装测试周期（通常需要几个月甚至一年以上）以及高昂的前期设计和制造费用（NRE Cost，可达数百万甚至数千万美元）相比，FPGA 的开发周期要短得多。
- FPGA 设计流程主要集中在 RTL 设计、验证和板级调试，不需要经历芯片制造过程。一旦设计完成并通过验证，就可以立即烧录到现成的 FPGA 芯片上进行测试和部署。
- 这使得 FPGA 成为产品早期开发、小批量生产或市场快速变化领域的理想选择。
5. 硬件/软件协同设计平台 (Hardware/Software Co-design Platform):
- 特别是在集成了硬核处理器的 SoC FPGA 出现后，FPGA 提供了一个强大的硬件/软件协同设计平台。
- 可以将需要高性能和并行性的任务放在 FPGA 的可编程逻辑中实现（硬件加速），而将控制、调度、接口、操作系统等任务放在硬核处理器上通过软件运行。这种软硬件结合的方式可以充分发挥两者的优势。

6. FPGA 的局限性与权衡 (Limitations and Trade-offs)

尽管 FPGA 有诸多优势，但它并不是万能的，也存在一些局限性：

1. 单位成本较高 (Higher Unit Cost):
- 对于大批量生产的产品来说，FPGA 的单位芯片成本通常比功能相同的 ASIC 要高得多。这是因为 FPGA 为了实现可编程性，内部集成了大量的配置存储单元和开关，并且其通用结构不如定制的 ASIC 电路紧凑和高效。
- ASIC 的前期投入高，但一旦流片成功并进入大批量生产，其单个芯片的制造成本可以做到非常低。因此，对于出货量巨大的消费电子产品，ASIC 仍然是首选。
2. 功耗较高 (Higher Power Consumption):
- 与同等工艺下实现相同功能的 ASIC 相比，FPGA 通常会消耗更多的电能。这同样是由于其内部的可编程结构（配置存储和开关）以及不如 ASIC 优化的布线导致的。
- 在对功耗非常敏感的应用中（如电池供电的移动设备、某些边缘计算设备），FPGA 可能不是最佳选择。
3. 最高时钟频率相对较低 (Lower Maximum Clock Frequency):
- 由于信号需要通过可编程的开关和布线资源传输，这会引入额外的延迟。尽管现代 FPGA 工艺和架构不断进步，但其最高工作频率通常仍然低于使用相同工艺制造的 ASIC。
- 对于需要极高主频的计算任务，ASIC 更具优势。
4. 设计复杂度和开发难度 (Design Complexity and Development Difficulty):
- FPGA 设计是硬件设计，与软件开发有很大的不同。需要理解数字电路原理、时序约束、并行设计思维，并且需要掌握 HDL 和复杂的 EDA（Electronic Design Automation）工具。
- 相较于软件开发，FPGA 设计的学习曲线通常更陡峭，开发和调试过程也可能更具挑战性。
5. 面积效率相对较低 (Lower Area Efficiency):
- 同样的功能，在 ASIC 上实现的电路面积通常会小于在 FPGA 上实现的面积。这是因为 FPGA 的通用可配置结构会引入额外的开销。

选择 FPGA 还是 ASIC 或 CPU，往往需要在性能、灵活性、开发周期、前期投入、单位成本和功耗等多个维度之间进行权衡。

7. FPGA 的主要应用领域

凭借其独特的优势，FPGA 在许多领域都发挥着不可替代的作用：

1. 数据中心加速 (Data Center Acceleration):
- 云计算和大数据时代对计算性能提出了巨大需求。FPGA 因其并行处理能力和低延迟特性，被广泛用于加速特定工作负载，如：
  - 人工智能/机器学习推理 (AI/ML Inference): 相较于 GPU 在训练方面的优势，FPGA 在推理阶段可以提供更高的能效比和更低的延迟。
  - 网络功能虚拟化 (NFV) 和软件定义网络 (SDN): 实现高性能网络数据包处理、负载均衡、防火墙等功能。
  - 数据压缩/解压缩、加密/解密。
  - 基因测序、金融建模等高性能计算任务。
2. 通信与网络 (Telecommunications and Networking):
- FPGA 是电信设备的核心组件之一，用于实现各种高速、复杂的通信协议和信号处理功能：
  - 基站 (Base Stations): 5G/4G 基带处理、波束赋形等。
  - 网络路由器和交换机: 数据包处理、流量管理。
  - 光传输网络 (Optical Transport Networks, OTN): 信号复用、解复用、交叉连接。
  - 卫星通信。
3. 航空航天与国防 (Aerospace and Defense):
- 这些领域对系统的可靠性、实时性、可重构性有极高要求。FPGA 在此有广泛应用：
  - 雷达和声纳信号处理。
  - 电子战系统。
  - 飞行控制系统。
  - 卫星有效载荷处理。
  - FPGA 的可重配置能力使得在任务执行中或部署后根据需要更改硬件功能成为可能，这在面对未知或变化的环境时非常有用。
4. 汽车电子 (Automotive):
- 随着汽车智能化水平提高，FPGA 在 ADAS（高级驾驶辅助系统）、自动驾驶、信息娱乐系统等方面扮演越来越重要的角色：
  - 传感器融合 (Sensor Fusion): 处理和整合来自摄像头、雷达、激光雷达等多种传感器的信息。
  - 实时图像和视频处理。
  - 车载网络桥接。
5. 工业自动化与控制 (Industrial Automation and Control):
- FPGA 的实时性、确定性、并行处理能力使其成为工业控制系统的理想选择：
  - 运动控制。
  - 机器视觉。
  - 实时数据采集和处理。
  - 复杂的控制算法实现。
6. 医疗设备 (Medical Devices):
- 需要高性能信号处理和图像处理的医疗设备也常常采用 FPGA：
  - 医学影像设备 (MRI, CT, Ultrasound)。
  - 基因测序设备。
  - 监护设备。
7. 消费电子 (Consumer Electronics):
- 虽然不像 CPU 或 ASIC 那样普遍，但在某些需要高性能信号处理或接口转换的消费电子产品中也能看到 FPGA 的身影，例如高端音频设备、视频处理设备等，或者作为 ASIC 验证的原型。

8. 如何入门 FPGA？

如果你对 FPGA 产生了兴趣，想要进一步学习，可以从以下几个方面入手：

学习数字电路基础： 理解逻辑门、组合逻辑、时序逻辑、状态机等基本概念是学习 FPGA 的前提。
学习硬件描述语言 (HDL): 选择 Verilog 或 VHDL 作为入门语言。这是描述硬件功能的工具。
学习 FPGA 开发工具链： 熟悉主要 FPGA 厂商（如 Xilinx 和 Intel，现为 AMD 和 Intel 的一部分）提供的开发套件，如 Vivado (AMD/Xilinx) 或 Quartus Prime (Intel)。掌握综合、实现、时序分析等工具的使用。
购买一块 FPGA 开发板： 从简单的入门级开发板开始，实践 HDL 代码的编写、综合、实现和下载，通过实验加深理解。
阅读相关书籍和在线教程： 有很多优秀的 FPGA 入门教材和在线资源可以帮助你学习。
从小项目开始实践： 从简单的电路（如 LED 闪烁、按键输入）到稍微复杂的项目（如计数器、有限状态机、简单的通信接口），逐步提升难度。

FPGA 的学习曲线可能比软件开发要陡峭一些，因为它涉及硬件思维和对时序的严格控制，但一旦掌握，你就获得了一种构建定制硬件的强大能力。

9. FPGA 的未来展望

FPGA 技术仍在不断发展。未来的 FPGA 将拥有更高的密度、更快的速度、更低的功耗，并集成更多样的硬核资源。随着人工智能、5G/6G 通信、边缘计算等技术的飞速发展，对高性能、低延迟、可灵活配置硬件的需求将持续增长，FPGA 的重要性也将进一步凸显。特别是 SoC FPGA，它将软件和硬件的优势更紧密地结合，有望在更广泛的领域发挥作用。

10. 总结

FPGA，这个“现场可编程门阵列”，是一种独特而强大的半导体芯片。它不像 CPU 那样执行软件指令，而是通过配置内部的逻辑单元和互连资源来构建定制的硬件电路。这种“可编程硬件”的特性赋予了它在性能、并行性、灵活性和开发周期方面的独特优势，使其在数据中心加速、通信、航空航天、汽车、工业控制等众多领域扮演着关键角色。

虽然 FPGA 的学习和开发需要掌握硬件设计思维和专门的工具，其单位成本和功耗在某些情况下可能不如 ASIC，但它在需要高性能并行处理、低延迟、或者需要在产品生命周期中修改硬件功能的场景下，提供了 CPU 和 ASIC 都无法替代的解决方案。

希望通过这篇文章，你对 FPGA 有了一个初步且较为深入的了解，认识到它在现代电子技术中的重要地位。如果你对硬件设计和底层系统感兴趣，探索 FPGA 的世界将会是一段充满挑战但也收获丰盛的旅程。