C语言必知：运算符优先级完整解析

在C语言编程中，表达式是将变量、常量和运算符组合起来的序列。理解表达式的计算顺序至关重要，它直接影响程序的逻辑和结果。决定表达式计算顺序的主要规则有两个：运算符优先级（Precedence）和运算符结合性（Associativity）。本文将带您深入了解C语言中运算符的优先级和结合性，帮助您避免常见的陷阱，写出更清晰、正确的代码。

为什么理解运算符优先级如此重要？

考虑一个简单的数学表达式：2 + 3 * 4。根据数学中的“先乘除后加减”规则，我们会先计算 3 * 4 = 12，然后再计算 2 + 12 = 14。如果忽略这个规则，从左到右计算，得到的结果将是 (2 + 3) * 4 = 5 * 4 = 20，这是错误的。

在C语言中，各种运算符（算术运算符、关系运算符、逻辑运算符、位运算符、赋值运算符等）都有自己的优先级。当一个表达式中包含多个不同优先级的运算符时，高优先级的运算符会先被考虑。如果表达式中包含同等优先级的运算符，则它们的计算顺序取决于它们的结合性。

不理解优先级和结合性，就无法确定复杂表达式的真正含义，可能导致程序计算出错误的结果，产生难以调试的Bug。

运算符优先级与结合性基础

优先级 (Precedence): 决定了在一个表达式中，哪个运算符会优先执行（或者说，哪个运算符的操作数会先被绑定）。优先级高的运算符比优先级低的运算符“更紧密地”绑定其操作数。例如，在 a + b * c 中，* 的优先级高于 +，所以 b * c 会先被看作一个整体，表达式相当于 a + (b * c)。
结合性 (Associativity): 当一个表达式中的多个运算符具有相同的优先级时，结合性决定了它们的计算顺序。结合性可以是左结合（从左到右）或右结合（从右到左）。
- 左结合: 大多数二元运算符（如 +, -, *, / 等）是左结合的。例如，a - b - c 会被解析为 (a - b) - c。
- 右结合: 一些运算符是右结合的，最常见的是赋值运算符和一元运算符。例如，a = b = c 会被解析为 a = (b = c)；-!x 会被解析为 -(!x)。

理解优先级和结合性，实际上就是理解编译器如何解析表达式，将其分解成一系列操作的步骤。

C语言运算符优先级完整表格

下表列出了C语言中所有运算符的优先级和结合性，从高到低排列。同一行中的运算符优先级相同。

优先级	运算符	描述	结合性
1	`()` `[]` `.` `->`	括号、数组下标、成员访问	左到右
2	`++` `--` (后缀)	后缀自增/自减	左到右
3	`++` `--` (前缀) `+` `-` `!` `~` `*` `&` `sizeof` `(type)`	前缀自增/自减、一元加/减、逻辑非、按位非、解引用、取地址、长度、强制类型转换	右到左
4	`*` `/` `%`	乘法、除法、取模	左到右
5	`+` `-`	加法、减法	左到右
6	`<<` `>>`	左移、右移	左到右
7	`<` `<=` `>` `>=`	关系运算符	左到右
8	`==` `!=`	相等运算符	左到右
9	`&`	按位与	左到右
10	`^`	按位异或	左到右
11	`\|`	按位或	左到右
12	`&&`	逻辑与	左到右
13	`\|\|`	逻辑或	左到右
14	`?:`	条件运算符	右到左
15	`=` `+=` `-=` `*=` `/=` `%=` `<<=` `>>=` `&=` `^=` `\|=`	赋值运算符及复合赋值	右到左
16	`,`	逗号运算符	左到右

注意： 这个表格是大多数C语言标准（如C99, C11, C18）所遵循的。不同版本的C标准或特定的编译器实现可能会有微小差异，但上述表格是通用的、标准的规则。

详细解析各优先级组别

让我们逐个或按组别详细探讨这些运算符及其优先级和结合性。

优先级 1：最高优先级 – Primary Expressions (初级表达式)

(): 括号。括号强制改变计算顺序。表达式 (a + b) * c 会先计算 a + b，再乘以 c。括号内的表达式具有最高的优先级。
[]: 数组下标。用于访问数组元素。例如 arr[i]。
.: 结构体/联合体成员直接访问。例如 person.name。
->: 结构体/联合体成员指针访问。例如 ptr->age。

这些运算符都是左结合的。例如，arr[i].member 会被解析为 (arr[i]).member，先访问数组元素，再访问该元素的成员。

优先级 2：后缀自增/自减

++ (后缀), -- (后缀): variable++, variable--。它们是左结合的，但这一点在实践中不常用，因为它们通常只作用于单个变量。重要的是理解它们与前缀形式的区别以及与解引用等运算符的交互。例如，p++ 是一个整体操作，它返回变量的原始值，然后在操作完成后再递增变量。

优先级 3：一元运算符

++ (前缀), -- (前缀): ++variable, --variable。先改变变量的值，再使用新值。
+ (一元), - (一元): 正号，负号。例如 +x, -y。
!: 逻辑非。例如 !is_ready。
~: 按位非。例如 ~flags。
*: 解引用（指针）。例如 *ptr。
&: 取地址。例如 &variable。
sizeof: 计算类型或变量的大小（字节）。例如 sizeof(int), sizeof(my_var)。
(type): 强制类型转换。例如 (float)integer_var。

所有一元运算符都是右结合的。这一点非常重要。例如，-!x 被解析为 -(!x)；*ptr++ 是一个经典的例子，++ (后缀) 优先级高于 * (一元)，但两者都属于较高优先级组别。根据后缀 ++ 的结合性和特性，它会先绑定 p，形成 p++。然后，由于 * 是右结合的，且与 p++ 具有相同的优先级（如果考虑后缀 ++ 的优先级稍高则优先绑定 p++），表达式被解析为 *(p++)。这意味着先执行 p++（返回 p 的旧值并递增 p），然后对旧值进行解引用。

另一个例子：char **ptr;。表达式 **ptr 被解析为 *(*ptr)，因为一元 * 是右结合的。

优先级 4：乘法、除法、取模

*, /, %: a * b, a / b, a % b。这些是标准的算术乘、除、取模运算，优先级高于加减。它们是左结合的。例如，a * b / c 等价于 (a * b) / c。

优先级 5：加法、减法

+, -: a + b, a - b。标准的加减运算，优先级低于乘除模。它们是左结合的。例如，a + b - c 等价于 (a + b) - c。

优先级 6：移位

<<, >>: value << shift_amount, value >> shift_amount。按位左移和右移。它们是左结合的。例如，a << b >> c 等价于 (a << b) >> c。

优先级 7：关系运算符

<, <=, >, >=: a < b, a <= b, a > b, a >= b。用于比较操作，结果为真 (1) 或假 (0)。它们是左结合的。例如，a < b > c（虽然不常见且可能无意义）等价于 (a < b) > c。

优先级 8：相等运算符

==, !=: a == b, a != b。用于比较是否相等或不相等，结果为真 (1) 或假 (0)。它们的优先级低于关系运算符。它们是左结合的。例如，a == b != c 等价于 (a == b) != c。

优先级 9, 10, 11：按位逻辑运算符

&: 按位与 (a & b)。优先级低于相等运算符。
^: 按位异或 (a ^ b)。优先级低于按位与。
|: 按位或 (a | b)。优先级低于按位异或。

这三个运算符都是左结合的。它们的优先级顺序是 & > ^ > |。例如，a & b ^ c | d 等价于 ((a & b) ^ c) | d。

优先级 12, 13：逻辑运算符

&&: 逻辑与 (condition1 && condition2)。优先级低于按位或。
||: 逻辑或 (condition1 || condition2)。优先级低于逻辑与。

这两个运算符都是左结合的，并且具有短路评估 (Short-circuit evaluation) 的特性。
* 对于 &&，如果 condition1 为假 (0)，则 condition2 不会被评估，整个表达式的结果为假。
* 对于 ||，如果 condition1 为真 (非0)，则 condition2 不会被评估，整个表达式的结果为真。

短路评估是逻辑运算符的重要特性，它影响了表达式的实际执行流程，与单纯的优先级/结合性规则有所不同。

优先级 14：条件运算符

?:: 三元条件运算符 (condition ? value_if_true : value_if_false)。优先级低于逻辑或。它是唯一一个需要三个操作数的运算符。它是右结合的。例如，a ? b : c ? d : e 被解析为 a ? b : (c ? d : e)。

优先级 15：赋值运算符

= += -= *= /= %= <<= >>= &= ^= |=: 赋值运算符和复合赋值运算符。这些运算符的优先级非常低，仅高于逗号运算符。它们都是右结合的。例如，a = b = c 被解析为 a = (b = c)。这意味着先将 c 的值赋给 b，然后将 b（现在是 c 的值）的值赋给 a。

优先级 16：最低优先级 – 逗号运算符

,: 逗号运算符 (expression1, expression2, ...)。具有最低的优先级。它是左结合的。expr1, expr2, expr3 会先评估 expr1，然后评估 expr2，最后评估 expr3。整个表达式的值是最后一个表达式 (expr3) 的值和类型。逗号运算符常用于 for 循环的初始化或步进部分，或者在一个语句中执行多个副作用操作。

优先级和结合性 vs. 评估顺序 (Order of Evaluation)

理解优先级和结合性是解析表达式的关键，它们决定了表达式如何被“分组”。然而，这并不完全等同于操作数的实际评估顺序。

优先级和结合性: 决定了表达式的语法结构（哪个操作符作用于哪些操作数），类似于构建一棵语法树。
评估顺序: 决定了表达式中各个部分（子表达式）实际计算的顺序。

对于大多数运算符，C语言标准并未指定操作数的评估顺序。例如，对于 a() + b() * c()，虽然我们知道 b() * c() 会被分组，但 a()、b() 和 c() 这三个函数调用的实际执行顺序是不确定的（除了 b() 和 c() 的结果会在执行完后用于乘法）。这种不确定性在涉及有副作用的表达式时（如函数调用、自增/自减运算）可能导致问题。例如，f() + g() 中 f() 和 g() 谁先执行是不确定的。

少数例外情况，评估顺序是确定的：

逻辑与 && 和逻辑或 ||: 强制从左到右评估，并具有短路特性。
逗号运算符 ,: 强制从左到右评估。
条件运算符 ?:: 先评估 condition，然后根据其结果只评估 value_if_true 或 value_if_false 中的一个。
函数调用: 函数参数的评估顺序在C中是不确定的（不同于逗号运算符），但在C++11及以后标准中，参数的评估顺序是确定的（从左到右）。但C语言仍然是不确定的。例如，func(a++, b++) 中，a++ 和 b++ 哪个先执行是不确定的。

因此，在编写涉及副作用的复杂表达式时，仅仅依赖优先级和结合性是不够的，还需要考虑评估顺序的不确定性。

最佳实践：如何避免优先级陷阱？

虽然了解优先级和结合性规则是C程序员的基础，但在实际编程中，过度依赖这些规则来编写简洁但晦涩的表达式是危险的。

使用括号： 这是最简单也最有效的避免歧义的方法。即使你确定某个表达式的优先级，使用括号可以使代码意图更清晰，提高可读性。例如，写 (a + b) * c 比 a + b * c 更直观地表达了先加后乘的意图。对于复杂的条件表达式，如 if ((a > 0 && b < 10) || c == 5)，括号的使用让逻辑结构一目了然。
分解复杂表达式： 不要试图在一个表达式中完成太多操作，特别是当涉及多种运算符和副作用时。将复杂的表达式分解成多个简单的语句，使用临时变量存储中间结果。这不仅提高了代码的可读性，也更容易调试。
警惕副作用： 避免在同一个表达式中多次修改同一个变量，尤其是在评估顺序不确定的情况下。例如，arr[i++] = i; 的行为就是未定义的，因为 i++ 的副作用与赋值运算符对 i 的使用之间的顺序不确定。
查阅文档： 当遇到不确定或不常见的运算符组合时，查阅C语言标准文档或可靠的参考资料是最好的办法。

总结

C语言的运算符优先级和结合性规则是理解和编写正确表达式的基础。它们决定了编译器如何解析表达式的结构。优先级高的运算符优先绑定，同等优先级的运算符根据结合性确定分组方向。然而，这与操作数的实际评估顺序有所区别，特别是在涉及副作用时。

掌握完整的优先级表格是必要的，但更重要的是在实践中遵循“清晰优先于简洁”的原则。通过适当地使用括号和分解复杂表达式，可以大大提高代码的可读性和可维护性，避免因优先级误解而导致的Bug。记住，清晰的代码不仅自己以后读得懂，也更容易被团队成员理解和维护。