Python数值计算利器：NumPy深度解析与实践

引言：从科学计算的基石说起

在当今数据驱动的时代，科学计算、数据分析、机器学习以及人工智能等领域对数值处理能力提出了前所未有的高要求。Python，以其简洁的语法和丰富的生态系统，已成为这些领域的主流编程语言。然而，Python原生的数据结构（如列表）在处理大规模数值数据时，其性能往往不尽如人意，主要原因在于：

动态类型特性：Python列表可以存储不同类型的数据，这导致在存储时需要额外的类型信息，并且在执行数学运算时，需要进行类型检查，增加了开销。
解释器开销：Python是解释型语言，循环操作等在底层执行时效率较低。
内存非连续性：Python列表的元素在内存中可能不是连续存储的，这使得CPU缓存利用率低下，无法充分发挥硬件优势。

为了克服这些局限，Python社区诞生了 NumPy (Numerical Python)。NumPy是Python科学计算的核心库，它提供了一个高性能的多维数组对象（ndarray）以及用于处理这些数组的工具。可以说，没有NumPy，就没有Python在科学计算领域的今天。它不仅为Python提供了强大的数值计算能力，更是许多其他知名科学计算库（如Pandas、SciPy、Matplotlib、Scikit-learn、TensorFlow、PyTorch等）的底层基石。

本文将深入探讨NumPy的核心概念、功能特性、常用操作及其在实际应用中的实践，旨在帮助读者全面理解和高效利用这个Python数值计算的强大引擎。

第一章：NumPy的诞生与核心优势

NumPy的起源可以追溯到Numeric和Numarray这两个库。在整合了两者的优点并进行了大量优化后，NumPy于2006年正式发布，并迅速成为Python科学计算领域的标准。它的核心优势体现在以下几个方面：

高性能：NumPy的底层实现使用了C和Fortran语言，这意味着其核心的数组操作是编译型代码，执行速度远超纯Python代码。特别是对于大规模数组运算，NumPy可以实现接近原生C/Fortran的性能。
多维数组对象ndarray：这是NumPy最核心的数据结构，它是一个同构的、多维的数组。所有元素必须是相同类型，且在内存中是连续存储的。这种设计极大地提高了内存访问效率和CPU缓存利用率。
丰富的数学函数库：NumPy提供了大量的通用函数（Universal Functions，简称UFuncs），这些函数能够对ndarray中的所有元素进行快速、广播式的数学运算，包括但不限于三角函数、指数、对数、四则运算等。
广播机制（Broadcasting）：NumPy的广播机制允许在形状不同的数组之间进行数学运算，而无需显式地进行复制或循环操作，这大大简化了代码，提高了运算效率。
与C/C++/Fortran等语言的良好集成：NumPy提供了一套机制，使得Python代码可以方便地调用C/C++/Fortran等语言编写的库，这对于需要极限性能的场景非常有用。
开源与活跃社区：作为一个开源项目，NumPy拥有一个庞大而活跃的社区，不断有新的功能和优化加入，保证了其持续的生命力。

第二章：NumPy的核心概念：ndarray

ndarray是NumPy最核心的数据结构，它代表了N维数组（N-dimensional array）。理解ndarray是掌握NumPy的关键。

2.1 `ndarray`的特性

同构性：ndarray中的所有元素必须是相同的数据类型（dtype），例如，全部是整数、浮点数或布尔值。这与Python列表可以存储任意类型元素形成鲜明对比。
多维性：ndarray可以是一维、二维、三维乃至更高维的数组。
固定大小：一旦创建，ndarray的大小（轴的长度）是固定的，不能像Python列表那样随意增删元素。如果需要改变大小，通常会创建一个新的ndarray。
内存连续性：ndarray的元素在内存中是连续存储的，这使得访问效率极高。

2.2 `ndarray`的重要属性

每个ndarray对象都有一系列重要的属性来描述其结构：

ndim：数组的维度（轴的数量）。例如，一维数组ndim为1，二维数组ndim为2。
shape：一个元组，表示数组每个维度的大小。例如，一个2行3列的矩阵，shape为(2, 3)。
size：数组中元素的总数量，等于shape中所有元素的乘积。
dtype：数组中元素的类型。NumPy有自己的数据类型系统，如int32、float64、bool等，这比Python原生的整数和浮点数更细致，更接近于C语言的数据类型。
itemsize：数组中每个元素所占的字节数。
nbytes：整个数组所占的字节数，等于size * itemsize。

示例代码：

“`python
import numpy as np

创建一个一维数组

arr1d = np.array([1, 2, 3, 4, 5])
print(“arr1d:”, arr1d)
print(“ndim:”, arr1d.ndim) # 输出: 1
print(“shape:”, arr1d.shape) # 输出: (5,)
print(“size:”, arr1d.size) # 输出: 5
print(“dtype:”, arr1d.dtype) # 输出: int64 (或根据系统而定)
print(“itemsize:”, arr1d.itemsize) # 输出: 8 (64位整数占8字节)
print(“nbytes:”, arr1d.nbytes) # 输出: 40 (5 * 8)

print(“-” * 30)

创建一个二维数组（矩阵）

arr2d = np.array([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
print(“arr2d:\n”, arr2d)
print(“ndim:”, arr2d.ndim) # 输出: 2
print(“shape:”, arr2d.shape) # 输出: (2, 3)
print(“size:”, arr2d.size) # 输出: 6
print(“dtype:”, arr2d.dtype) # 输出: float64
print(“itemsize:”, arr2d.itemsize) # 输出: 8 (64位浮点数占8字节)
print(“nbytes:”, arr2d.nbytes) # 输出: 48 (6 * 8)
“`

2.3 `ndarray`的创建方法

NumPy提供了多种创建ndarray的方法：

np.array()：从Python列表或元组创建数组。

“`python
list_data = [1, 2, 3]
arr_from_list = np.array(list_data)
print(“From list:”, arr_from_list)

tuple_data = ((1, 2, 3), (4, 5, 6))
arr_from_tuple = np.array(tuple_data)
print(“From tuple:\n”, arr_from_tuple)

可以指定数据类型

arr_int16 = np.array([1, 2, 3], dtype=np.int16)
print(“With dtype:”, arr_int16, arr_int16.dtype)
“`
np.zeros()，np.ones()，np.empty()：创建全零、全一或空（未初始化）数组。

“`python
zeros_arr = np.zeros((2, 3)) # 2行3列的全零数组
print(“Zeros:\n”, zeros_arr)

ones_arr = np.ones((4,), dtype=np.int32) # 一维全一数组，元素类型为int32
print(“Ones:”, ones_arr)

empty_arr = np.empty((2, 2)) # 元素值是随机的，取决于内存内容
print(“Empty:\n”, empty_arr)
“`
np.arange()：创建包含等间隔值的数组（类似Python的range()）。

python arr_range = np.arange(0, 10, 2) # 从0到10（不包含10），步长为2 print("Arange:", arr_range)
np.linspace()，np.logspace()：创建在指定区间内均匀分布（线性或对数）的数组。

“`python
arr_linspace = np.linspace(0, 10, 5) # 从0到10，包含0和10，共5个元素
print(“Linspace:”, arr_linspace)

arr_logspace = np.logspace(0, 2, 3) # 10^0 到 10^2 之间，3个点
print(“Logspace:”, arr_logspace) # 输出: [1. 10. 100.]
“`
随机数生成：np.random模块提供了多种生成随机数的函数。

“`python
rand_arr = np.random.rand(2, 3) # 2×3的数组，元素在[0, 1)之间均匀分布
print(“Random Uniform:\n”, rand_arr)

randn_arr = np.random.randn(2, 3) # 2×3的数组，元素服从标准正态分布
print(“Random Normal:\n”, randn_arr)

randint_arr = np.random.randint(0, 10, size=(2, 2)) # 2×2的数组，元素在[0, 10)之间随机整数
print(“Random Int:\n”, randint_arr)
“`

第三章：数组操作基础

掌握ndarray的创建后，接下来是其核心操作，包括索引、切片、重塑、合并与分割等。

3.1 索引与切片

NumPy的索引和切片功能非常强大，支持类似Python列表的单元素索引和切片，以及更高级的多维索引。

单元素索引：

python arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) print("Original array:\n", arr) print("Element (0, 0):", arr[0, 0]) # 第0行第0列 print("Element (1, 2):", arr[1, 2]) # 第1行第2列
切片（Slicing）：使用start:stop:step语法。

python print("First row:", arr[0, :]) # 第0行的所有元素 print("First column:", arr[:, 0]) # 第0列的所有元素 print("Sub-array (1:3, 1:3):\n", arr[1:3, 1:3]) # 1到2行，1到2列 print("Every other row:", arr[::2, :]) # 隔行取

注意：NumPy数组的切片返回的是原数组的视图（view），而不是副本（copy）。这意味着修改切片会同时修改原数组。

python sub_arr = arr[0, 0:2] print("Sub array (view):", sub_arr) # [1 2] sub_arr[0] = 99 print("Modified sub array:", sub_arr) # [99 2] print("Original array after modify:\n", arr) # arr[0,0] 变为 99

如果需要副本，请使用copy()方法：

python sub_arr_copy = arr[0, 0:2].copy() sub_arr_copy[0] = 100 print("Sub array (copy):", sub_arr_copy) print("Original array after modify copy:\n", arr) # 原数组不受影响
布尔索引（Boolean Indexing）：使用布尔数组作为索引，选择满足条件的元素。

python data = np.array([1, 2, 3, 4, 5, 6]) even_numbers = data[data % 2 == 0] print("Even numbers:", even_numbers) # [2 4 6]
花式索引（Fancy Indexing）：使用整数数组作为索引，选择不连续的元素。

“`python
arr = np.arange(10)
indices = np.array([0, 2, 5, 8])
selected_elements = arr[indices]
print(“Selected elements:”, selected_elements) # [0 2 5 8]

对于二维数组

arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
row_indices = np.array([0, 2])
col_indices = np.array([1, 0])

选取 (0,1) 和 (2,0) 处的元素

selected_elements_2d = arr2d[row_indices, col_indices]
print(“Selected elements 2D:”, selected_elements_2d) # [2 7]
“`

3.2 数组形状操作

重塑（Reshaping）：使用reshape()改变数组的形状，但不改变其数据。

“`python
arr = np.arange(12) # [ 0 1 2 3 4 5 6 7 8 9 10 11]
reshaped_arr = arr.reshape((3, 4)) # 3行4列
print(“Reshaped array:\n”, reshaped_arr)

-1表示该维度的大小由NumPy自动推断

reshaped_auto = arr.reshape((2, -1)) # 2行，列数自动推断为6
print(“Auto-reshaped array:\n”, reshaped_auto)
“`
扁平化（Flattening）：将多维数组转换为一维数组。flatten()返回副本，ravel()返回视图。

“`python
matrix = np.array([[1, 2], [3, 4]])
flattened_copy = matrix.flatten()
print(“Flattened (copy):”, flattened_copy)

raveled_view = matrix.ravel()
print(“Raveled (view):”, raveled_view)
“`
转置（Transpose）：交换数组的行和列。

python matrix = np.arange(1, 7).reshape(2, 3) print("Original matrix:\n", matrix) transposed_matrix = matrix.T print("Transposed matrix:\n", transposed_matrix)

3.3 数组合并与分割

合并（Concatenation/Stacking）：
- np.concatenate()：沿现有轴合并。
  
  python arr1 = np.array([[1, 2], [3, 4]]) arr2 = np.array([[5, 6], [7, 8]]) concat_row = np.concatenate((arr1, arr2), axis=0) # 沿行（垂直）合并 print("Concat along axis 0:\n", concat_row) concat_col = np.concatenate((arr1, arr2), axis=1) # 沿列（水平）合并 print("Concat along axis 1:\n", concat_col)
- np.vstack() (vertical stack) / np.hstack() (horizontal stack) / np.dstack() (depth stack)：针对特定维度的合并快捷方式。
  
  python vstacked = np.vstack((arr1, arr2)) # 等同于 concatenate(..., axis=0) print("VStacked:\n", vstacked) hstacked = np.hstack((arr1, arr2)) # 等同于 concatenate(..., axis=1) print("HStacked:\n", hstacked)
分割（Splitting）：
- np.split()：沿指定轴将数组分割成多个子数组。
- np.vsplit() / np.hsplit() / np.dsplit()：针对特定维度的分割快捷方式。
“`python
arr = np.arange(16).reshape(4, 4)
print(“Original array for splitting:\n”, arr)
h_split_arr = np.hsplit(arr, 2) # 水平方向等分成2份
print(“Hsplit (part 1):\n”, h_split_arr[0])
print(“Hsplit (part 2):\n”, h_split_arr[1])

v_split_arr = np.vsplit(arr, [1, 3]) # 垂直方向在索引1和3处分割
print(“Vsplit (part 1):\n”, v_split_arr[0]) # 第0行
print(“Vsplit (part 2):\n”, v_split_arr[1]) # 第1、2行
print(“Vsplit (part 3):\n”, v_split_arr[2]) # 第3行
“`

第四章：强大的数学运算

NumPy提供了极其丰富的数学运算功能，这些功能通常以通用函数（UFuncs）的形式实现，并针对ndarray进行了高度优化。

4.1 元素级运算

NumPy数组支持所有常见的元素级算术、比较和逻辑运算。这些运算会自动作用于数组的每个元素。

“`python
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

print(“Addition:”, a + b) # [5 7 9]
print(“Subtraction:”, a – b) # [-3 -3 -3]
print(“Multiplication:”, a * b) # [ 4 10 18] (元素级乘法)
print(“Division:”, a / b) # [0.25 0.4 0.5 ]

print(“Greater than:”, a > 2) # [False False True]
print(“Logical AND:”, (a > 0) & (a < 3)) # [True True False]
“`

4.2 通用函数（UFuncs）

UFuncs是NumPy中对ndarray进行元素级操作的函数，它们是NumPy性能优异的关键。常见的UFuncs包括：

数学运算：np.sqrt() (平方根), np.exp() (指数), np.log() (对数), np.sin() (正弦), np.cos() (余弦), np.abs() (绝对值), np.ceil() (向上取整), np.floor() (向下取整), np.round() (四舍五入) 等。

python x = np.array([-1.5, 0, 1.5, 2.8]) print("Absolute:", np.abs(x)) # [1.5 0. 1.5 2.8] print("Square Root:", np.sqrt(x[x>=0])) # [0. 1.22474487 1.67332005] print("Exponential:", np.exp(x)) # [0.22313016 1. 4.48168907 16.44464677]
统计函数：np.mean() (均值), np.median() (中位数), np.std() (标准差), np.var() (方差), np.min() (最小值), np.max() (最大值), np.sum() (求和), np.argmin() (最小值索引), np.argmax() (最大值索引) 等。这些函数通常支持axis参数，用于指定在哪一个轴上进行计算。

“`python
matrix = np.arange(1, 10).reshape(3, 3)
print(“Matrix:\n”, matrix)

print(“Sum of all elements:”, np.sum(matrix)) # 45
print(“Mean of rows (axis=1):”, np.mean(matrix, axis=1)) # [2. 5. 8.]
print(“Max of columns (axis=0):”, np.max(matrix, axis=0)) # [7 8 9]
print(“Index of max element (flattened):”, np.argmax(matrix)) # 8
“`

4.3 线性代数运算

NumPy的numpy.linalg模块提供了丰富的线性代数功能，对于处理矩阵运算至关重要。

点积（Dot Product）/矩阵乘法：
- 对于一维数组，是向量点积。
- 对于二维数组，是矩阵乘法。
- np.dot() 函数或 @ 运算符。
“`python
vec1 = np.array([1, 2])
vec2 = np.array([3, 4])
print(“Vector dot product:”, np.dot(vec1, vec2)) # 13 + 24 = 11

mat1 = np.array([[1, 2], [3, 4]])
mat2 = np.array([[5, 6], [7, 8]])
print(“Matrix multiplication (dot):\n”, np.dot(mat1, mat2))
print(“Matrix multiplication (@ operator):\n”, mat1 @ mat2)
“`
其他线性代数函数：
- np.linalg.inv()：计算矩阵的逆。
- np.linalg.det()：计算矩阵的行列式。
- np.linalg.eig()：计算特征值和特征向量。
- np.linalg.solve()：求解线性方程组。
python A = np.array([[1, 2], [3, 4]]) inv_A = np.linalg.inv(A) print("Inverse of A:\n", inv_A) print("Determinant of A:", np.linalg.det(A)) # 1*4 - 2*3 = -2

第五章：NumPy进阶特性

5.1 广播机制（Broadcasting）

广播机制是NumPy处理不同形状数组之间算术运算的一种强大且灵活的方式。当操作两个数组时，NumPy会尝试通过广播规则使它们的形状兼容，而无需进行显式复制，这显著提高了效率。

广播规则：
要使两个数组可广播，需要满足以下条件之一：
1. 维度相等：两个数组的维度相同。
2. 维度不等：
* 沿着轴迭代时，两个数组的维度大小相等。
* 或者其中一个维度的大小为1。
* 如果一个数组的维度比另一个少，则将其形状的前面用1填充，直到维度数相等。

示例：

标量与数组运算：
python arr = np.array([1, 2, 3]) print("Scalar addition:", arr + 5) # [6 7 8]
(5被广播成 [5, 5, 5])
不同形状数组运算：
“`python
a = np.array([[1, 2, 3], [4, 5, 6]]) # shape (2, 3)
b = np.array([10, 20, 30]) # shape (3,)

NumPy会将b的形状视为 (1, 3)，然后将其“拉伸”成 (2, 3)

[10 20 30] -> [[10 20 30],

[10 20 30]]

result = a + b
print(“Broadcasting example 1:\n”, result)

Output:

[[11 22 33]

[14 25 36]]

c = np.array([[100], [200]]) # shape (2, 1)

NumPy会将c的形状视为 (2, 1)，然后将其“拉伸”成 (2, 3)

[[100] -> [[100 100 100],

[200]] [200 200 200]]

result2 = a + c
print(“Broadcasting example 2:\n”, result2)

Output:

[[101 102 103]

[204 205 206]]

“`
广播机制是NumPy高效执行复杂数组运算的关键，它能避免显式创建庞大的中间数组，节省内存并提高速度。

5.2 结构化数组（Structured Arrays）

虽然ndarray是同构的，但NumPy也支持创建结构化数组，其中每个元素可以有不同的字段（field），每个字段有自己的数据类型。这有点类似于C语言的结构体或数据库的行。

“`python
data = np.zeros(2, dtype={‘names’: (‘name’, ‘age’, ‘weight’),
‘formats’: (‘U10’, ‘i4’, ‘f8’)})
print(“Structured array dtype:”, data.dtype)
name = [‘Alice’, ‘Bob’]
age = [25, 30]
weight = [65.5, 78.2]

data[‘name’] = name
data[‘age’] = age
data[‘weight’] = weight

print(“Structured array:\n”, data)
print(“Alice’s age:”, data[0][‘age’])
“`
结构化数组在某些特定场景下非常有用，例如处理混合类型的数据集，但对于更复杂的数据表操作，Pandas库通常是更优的选择。

5.3 文件I/O操作

NumPy提供了方便的函数来保存和加载ndarray到磁盘：

np.save() / np.load()：保存/加载单个NumPy数组（.npy格式，二进制）。
np.savez() / np.savez_compressed()：保存多个NumPy数组到.npz文件。
np.savetxt() / np.loadtxt()：保存/加载文本格式的数据。

“`python
arr_to_save = np.arange(100).reshape(10, 10)
np.save(‘my_array.npy’, arr_to_save)
loaded_arr = np.load(‘my_array.npy’)
print(“Loaded array from .npy:\n”, loaded_arr[:2, :2])

np.savetxt(‘my_data.txt’, arr_to_save, fmt=’%d’, delimiter=’,’) # 保存为整数，逗号分隔
loaded_txt_arr = np.loadtxt(‘my_data.txt’, delimiter=’,’)
print(“Loaded array from .txt:\n”, loaded_txt_arr[:2, :2])
“`

5.4 性能优化技巧

要充分发挥NumPy的性能，关键在于向量化（Vectorization）。

避免显式Python循环：NumPy的UFuncs和各种数组操作都已经在底层C/Fortran层面实现了高效的循环。尽量用NumPy函数替代Python的for循环。

“`python

慢速 Python 循环

list_a = list(range(1000000))
list_b = list(range(1000000))

%timeit [list_a[i] + list_b[i] for i in range(len(list_a))] # 约几十毫秒

快速 NumPy 向量化操作

np_a = np.arange(1000000)
np_b = np.arange(1000000)

%timeit np_a + np_b # 约几毫秒

“`
利用广播机制：合理利用广播可以避免创建不必要的中间数组，节省内存和时间。
选择合适的数据类型：根据数据的范围和精度选择合适的dtype（如int8、float32），可以节省内存并可能提高某些操作的速度。
就地操作（In-place operations）：对于某些大型数组，如果不需要保留原数组，可以使用就地操作（如a += b 而不是 a = a + b）来减少内存分配和复制。

第六章：NumPy在科学计算中的应用

NumPy作为Python科学计算的基石，其应用无处不在：

数据分析：Pandas库构建在NumPy之上，其核心DataFrame和Series对象内部存储着NumPy数组，NumPy的索引、切片和矢量化操作是Pandas高效处理数据的关键。
机器学习：Scikit-learn、TensorFlow、PyTorch等主流机器学习框架都将NumPy数组作为基本数据结构。数据预处理、特征工程、模型训练中的矩阵运算等都离不开NumPy。
图像处理：图像可以被表示为多维NumPy数组（例如，一张彩色图片是高度×宽度×3（RGB通道）的三维数组）。OpenCV、Scikit-image等图像处理库大量使用NumPy进行图像的读取、修改、滤波、变换等操作。
信号处理：在音频处理、传感器数据分析等领域，信号通常以一维NumPy数组表示，NumPy提供了傅里叶变换、卷积等基本操作，而SciPy.signal则在此基础上提供了更专业的工具。
科学模拟与物理计算：NumPy的矩阵运算、随机数生成以及各种数学函数，使其成为物理学、工程学、化学等领域进行数值模拟和数据分析的理想工具。
金融建模：在金融领域，NumPy被用于处理时间序列数据、构建投资组合、风险评估、期权定价模型的蒙特卡洛模拟等。

第七章：与Python生态中其他库的协同

NumPy并非孤立存在，它与Python科学计算生态系统中的其他库紧密协同，共同构成了强大的数据处理和分析工具链。

Pandas：Pandas的DataFrame和Series对象是NumPyndarray的抽象和扩展，提供了更丰富的数据标签、缺失值处理和数据对齐功能。在Pandas内部，大量的操作最终都会委托给NumPy进行高效的数组计算。
Matplotlib：NumPy数组是Matplotlib绘图库的天然数据源。无论是绘制简单的折线图、散点图，还是复杂的图像、三维图，Matplotlib都能直接接收NumPy数组作为输入，并高效渲染。
SciPy：SciPy（Scientific Python）是NumPy的上层库，提供了更多高级的科学计算功能，如优化、积分、插值、信号处理、图像处理、统计等。SciPy的许多函数都以NumPy数组作为输入和输出，它们共同构成了Python科学计算的核心。
Jupyter Notebook/Lab：NumPy在Jupyter环境中表现出色。用户可以在交互式笔记本中编写NumPy代码，实时查看结果，并结合Matplotlib进行数据可视化，极大地提高了科研和数据分析的效率。
Scikit-learn/TensorFlow/PyTorch：这些机器学习和深度学习框架都将NumPy数组作为其数据接口标准。你可以用NumPy准备和预处理数据，然后将其传递给这些框架进行模型训练，或者将框架输出的结果转换为NumPy数组进行后续分析和可视化。

结论：NumPy——数值计算的Python力量之源

通过对NumPy的深度解析与实践，我们不难发现其在Python数值计算领域的核心地位。从其高性能的多维数组ndarray，到丰富的数学运算、强大的广播机制，再到与Python科学计算生态中其他库的无缝集成，NumPy为科研人员、数据科学家和工程师提供了无与伦比的工具集。

掌握NumPy，意味着你获得了处理大规模数值数据、进行高效科学计算的强大能力，这不仅能显著提升你的工作效率，更能打开通往数据分析、机器学习、人工智能等前沿领域的大门。它不仅仅是一个库，更是一种思维方式，一种以数组为中心进行数据处理和计算的范式。

NumPy仍在不断发展，未来也将继续作为Python科学计算的基石，支撑着数据科学领域的创新与进步。深入学习并实践NumPy，无疑是每一位Python开发者在探索数值计算世界的必经之路。

Python数值计算利器：NumPy深度解析与实践

引言：从科学计算的基石说起

第一章：NumPy的诞生与核心优势

第二章：NumPy的核心概念：ndarray

2.1 ndarray的特性

2.2 ndarray的重要属性

创建一个一维数组

创建一个二维数组（矩阵）

2.3 ndarray的创建方法

可以指定数据类型

第三章：数组操作基础

3.1 索引与切片

对于二维数组

选取 (0,1) 和 (2,0) 处的元素

3.2 数组形状操作

-1表示该维度的大小由NumPy自动推断

3.3 数组合并与分割

第四章：强大的数学运算

4.1 元素级运算

4.2 通用函数（UFuncs）

4.3 线性代数运算

第五章：NumPy进阶特性

5.1 广播机制（Broadcasting）

NumPy会将b的形状视为 (1, 3)，然后将其“拉伸”成 (2, 3)

[10 20 30] -> [[10 20 30],

[10 20 30]]

Output:

[[11 22 33]

[14 25 36]]

NumPy会将c的形状视为 (2, 1)，然后将其“拉伸”成 (2, 3)

[[100] -> [[100 100 100],

[200]] [200 200 200]]

Output:

[[101 102 103]

[204 205 206]]

5.2 结构化数组（Structured Arrays）

5.3 文件I/O操作

5.4 性能优化技巧

慢速 Python 循环

%timeit [list_a[i] + list_b[i] for i in range(len(list_a))] # 约几十毫秒

快速 NumPy 向量化操作

%timeit np_a + np_b # 约几毫秒