NumPy(Numerical Python)是Python的一种开源的数值计算扩展,提供了多维数组对象ndarray,是一个快速、灵活的大数据容器,可以用来存储和处理大型矩阵,支持大量的维度数组与矩阵运算,并针对数组运算提供大量的数学函数库。这些函数可以直接在数组和矩阵上操作,大大简化了数据处理和分析的复杂度。
NumPy数组的元素类型必须相同,具有同质性,以提高元素查找效率。同时,NumPy数组的元素可以通过基于0的下标单独访问。NumPy数组还通过dtype和shape属性表示元素的类型和维度,其中维度的类型是元组,按照从高到低的顺序来排列每一维的大小。
NumPy的优点在于其提供了大量数值计算的函数,能够进行线性代数的相关操作,并且由于其底层用C编写,因此执行效率非常高。这使得NumPy在科学计算、数据分析、机器学习、深度学习以及人工智能等领域有着广泛的应用。
安装NumPy的方法有多种,包括使用pip、conda或者从源码进行安装。在命令行中输入pip install numpy即可从Python官方的包索引中下载和安装最新版的NumPy。如果需要安装特定版本的NumPy,可以在命令中指定版本号,例如pip install numpy==1.19.3将安装NumPy的1.19.3版本。
简单举例:
以下是一些NumPy的简单使用例子:
- 创建数组:
使用np.array()函数可以直接创建一个NumPy数组。
| import numpy as np  | |
| # 创建一个一维数组  | |
| arr1 = np.array([1, 2, 3, 4, 5])  | |
| print(arr1) # 输出: [1 2 3 4 5]  | |
| # 创建一个二维数组  | |
| arr2 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])  | |
| print(arr2)  | |
| # 输出:  | |
| # [[1 2 3]  | |
| # [4 5 6]  | |
| # [7 8 9]] | 
2.基本数学运算:
NumPy支持对数组进行基本的数学运算,如加法、减法、乘法、除法等。
| # 创建两个数组  | |
| a = np.array([1, 2, 3])  | |
| b = np.array([4, 5, 6])  | |
| # 数组加法  | |
| c = a + b  | |
| print(c) # 输出: [5 7 9]  | |
| # 数组乘法  | |
| d = a * b  | |
| print(d) # 输出: [ 4 10 18] | 
3.索引和切片:
可以使用索引和切片来访问和修改数组中的元素。
| # 使用索引访问数组元素  | |
| element = arr2[0, 1] # 访问第一行第二列的元素  | |
| print(element) # 输出: 2  | |
| # 使用切片访问数组的子集  | |
| subset = arr2[:2, 1:] # 访问前两行,从第二列开始到最后的所有列  | |
| print(subset)  | |
| # 输出:  | |
| # [[2 3]  | |
| # [5 6]] | 
4.创建特殊数组:
NumPy提供了创建特殊类型数组的函数,如零数组、一数组、等差数组等。
| # 创建零数组  | |
| zeros_arr = np.zeros((3, 3))  | |
| print(zeros_arr)  | |
| # 输出:  | |
| # [[0. 0. 0.]  | |
| # [0. 0. 0.]  | |
| # [0. 0. 0.]]  | |
| # 创建一数组  | |
| ones_arr = np.ones((2, 2), dtype=np.int)  | |
| print(ones_arr)  | |
| # 输出:  | |
| # [[1 1] | |
| # [1 1]]  | |
| # 创建等差数组  | |
| linspace_arr = np.linspace(0, 10, 5) # 从0到10,生成5个数  | |
| print(linspace_arr) # 输出: [ 0. 2.5 5. 7.5 10. ] | 
NumPy作为Python中科学计算的基础包,功能丰富且强大,除了上述的基本功能外,还有许多其他高级功能。以下是一些NumPy的高级功能示例:
1.数组重塑:
 NumPy提供了reshape方法,允许用户改变数组的形状而不改变其数据。例如,你可以将一个一维数组重塑为二维数组,或者将一个二维数组重塑为三维数组等。
| import numpy as np  | |
| a = np.array([1, 2, 3, 4, 5, 6])  | |
| b = a.reshape(2, 3)  | |
| print(b)  | |
| # 输出:  | |
| # [[1 2 3]  | |
| # [4 5 6]] | 
2.数组合并:
 使用np.concatenate函数,你可以沿着指定的轴将多个数组合并成一个数组。
| a = np.array([1, 2, 3])  | |
| b = np.array([4, 5, 6])  | |
| c = np.concatenate((a, b))  | |
| print(c)  | |
| # 输出: [1 2 3 4 5 6] | 
3.布尔索引:
 通过布尔索引,你可以基于条件选择数组中的元素。
| arr = np.array([1, 2, 3, 4, 5])  | |
| filtered_arr = arr[arr > 3]  | |
| print(filtered_arr)  | |
| # 输出: [4 5] | 
4.花式索引:
 花式索引允许你使用整数数组来索引数组中的元素。这可以用于选择非连续的元素或进行复杂的切片操作。
| arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])  | |
| selected_elements = arr[[0, 1, 2], [0, 1, 2]]#在NumPy中,使用两个整数数组进行索引时,第一个数组指定了行索引,第二个数组指定了列索引。这种方式被称为“花式索引”或“高级索引”。 | |
| print(selected_elements)  | |
| # 输出: [1 5 9] 这里的arr[[0, 1, 2], [0, 1, 2]]实际上选择的是(0, 0),(1, 1), 和(2, 2)这三个位置的元素,即对角线元素。 | 
5.线性代数运算:
 NumPy提供了许多线性代数函数,如矩阵乘法、矩阵转置、求解线性方程组、计算特征值和特征向量等。
| A = np.array([[1, 2], [3, 4]])  | |
| B = np.array([[5, 6], [7, 8]])  | |
| C = np.dot(A, B) # 矩阵乘法  | |
| print(C)  | |
| # 输出:  | |
| # [[19 22]  | |
| # [43 50]] | 
6.随机数生成:
 NumPy提供了多种随机数生成函数,可以用于生成均匀分布、正态分布等不同分布的随机数。
| # 生成0到1之间的随机浮点数  | |
| random_float = np.random.rand()  | |
| print(random_float)  | |
| # 生成形状为(3, 3)的随机数矩阵 也是01之间的数 | |
| random_matrix = np.random.rand(3, 3)  | |
| print(random_matrix) | 
如果随机数矩阵不在0到1之间,而是具有其他范围或分布,NumPy提供了多种函数来满足这些需求。以下是一些常用的方法:
- 指定范围:使用np.random.uniform函数可以指定随机数的下限和上限。
| import numpy as np  | |
| # 生成形状为(3, 3)的随机数矩阵,元素范围在a和b之间  | |
| a, b = 5, 10 # 指定范围  | |
| random_matrix = np.random.uniform(a, b, size=(3, 3))  | |
| print("随机数矩阵:\n", random_matrix) | 
2.整数随机数:使用np.random.randint函数可以生成指定范围内的整数随机数。
| import numpy as np  | |
| # 生成形状为(3, 3)的整数随机矩阵,元素范围在low和high之间(包括low,不包括high)  | |
| low, high = 5, 10 # 指定范围  | |
| random_matrix = np.random.randint(low, high, size=(3, 3))  | |
| print("整数随机数矩阵:\n", random_matrix) | 
3.正态分布:使用np.random.randn或np.random.normal函数可以生成符合正态分布的随机数。
| import numpy as np  | |
| # 生成形状为(3, 3)的正态分布随机数矩阵,均值为mu,标准差为sigma  | |
| mu, sigma = 0, 1 # 均值和标准差  | |
| random_matrix = np.random.normal(mu, sigma, size=(3, 3))  | |
| print("正态分布随机数矩阵:\n", random_matrix) | 
3.其他分布:NumPy还提供了其他分布,如指数分布(np.random.exponential)、泊松分布(np.random.poisson)等,您可以根据需要选择合适的函数。
请注意,上述函数中的size参数用于指定输出数组的形状。如果您想生成一个3x3的矩阵,就应该将size设置为(3, 3)。此外,还可以通过调整分布的参数(如均值、标准差、范围等)来控制随机数的特性。
这些只是NumPy功能的冰山一角。NumPy还提供了大量的数学函数、统计函数、线性代数函数等,可以方便地处理各种数值计算任务。无论是数据科学、机器学习还是科学计算,NumPy都是一个非常强大的工具。
总的来说,NumPy是一个强大且灵活的工具,对于需要进行数值计算和数据处理的任务来说,它是一个不可或缺的选择。