Python数据科学速查表 - Numpy 基础.pdf
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
在Python数据科学中,NumPy库是不可或缺的一部分,它提供了高效的数据处理能力,特别是对于多维数组的操作。NumPy库的引入通常通过`import numpy as np`语句完成。本篇速查表主要涵盖以下几个核心知识点: 1. **创建数组**: - `np.zeros(shape)`:创建指定形状的全零数组。 - `np.ones(shape,dtype)`:创建指定形状的全一数组,`dtype`用于指定数据类型。 - `np.arange(start,stop,step)`:创建一个等差序列,从`start`到`stop`,步长为`step`。 - `np.linspace(start,stop,num)`:创建指定数量`num`个等差间隔的数组,范围从`start`到`stop`。 - `np.full(shape,value,dtype)`:创建指定形状的数组,所有元素都为`value`。 - `np.eye(N)`:创建一个N×N的单位矩阵。 - `np.random.random(size)`:生成指定大小的随机浮点数数组,取值范围在0到1之间。 - `np.empty(shape)`:创建一个未初始化的空数组。 2. **数组计算**: - 基本的数学运算如加、减、乘、除:如`a + b`, `a - b`, `a * b`, `a / b`,以及对应的函数版本`np.add`, `np.subtract`, `np.multiply`, `np.divide`。 - 幂运算:`a ** b` 或 `np.power(a,b)`。 - 平方根:`np.sqrt(a)`。 - 正弦、余弦、自然对数:`np.sin(a)`, `np.cos(b)`, `np.log(a)`。 - 点积:`e.dot(f)`。 3. **数组操作**: - 数组汇总:`a.sum()`, `a.min()`, `b.max(axis=0)`,分别获取数组元素的总和、最小值和按指定轴的最大值。 - 累加值:`b.cumsum(axis=1)`,沿指定轴计算累积和。 - 统计量:`a.mean()`, `b.median()`,计算平均值和中位数。 - 相关系数:`a.corrcoef()`,计算数组元素之间的相关系数。 - 标准差:`np.std(b)`,计算标准差。 4. **索引和切片**: - 单元格访问:如`a[0]`获取第一行。 - 切片:如`a[1:3]`获取第二行到第三行。 - 索引操作:如`a[::2]`获取所有偶数索引的元素。 - 索引和切片可以结合使用以访问特定部分的数组。 5. **比较操作**: - 对比值:如`a == b`,创建一个布尔型数组表示两个数组对应位置的元素是否相等。 - 判断条件:如`a < 2`,创建一个布尔型数组表示`a`中的元素是否小于2。 6. **数组操作**: - 转置:`np.transpose(b)` 或 `b.T`,交换数组的轴。 - 拉平:`b.ravel()`,将数组转换为一维数组。 - 重塑:`g.reshape(3,-2)`,改变数组形状,-1表示自动计算长度。 - 追加数据:`np.append(h,g)`,在数组末尾添加另一个数组。 - 插入数据:`np.insert(a, 1, 5)`,在指定位置插入值。 - 删除数据:`np.delete(a,[1])`,从数组中删除指定索引的元素。 7. **数组合并与分割**: - 水平拼接:`np.concatenate((a,d),axis=0)`,沿着第一个轴(行)连接数组。 - 垂直堆叠:`np.vstack((a,b))`,沿着第二个轴(列)连接数组。 - 横向堆叠:`np.hstack((e,f))`,沿着最后一个轴连接数组。 - 列堆叠:`np.column_stack((a,d))`,将数组作为列合并。 - 分割数组:`np.hsplit(a,3)`,按指定数量水平分割数组,返回一个包含子数组的列表。 以上就是NumPy基础操作的概览,这些功能使得NumPy成为Python数据科学中的强大工具,能够高效地处理大量数据,进行各种复杂的数学计算和数组操作。理解并熟练掌握这些知识点是进行数据科学项目的基础。
- 粉丝: 3806
- 资源: 59万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助