python中的numpy模块

发布时间: 2022-12-21 07:55:22

㈠图解python中数据分析工具包：Numpy

numpy是我学习python遇到的第一个第三方工具包，它可以让我们快速上手数据分析。numpy提供了向量和矩阵计算和处理的大部分接口。目前很多python的基础工具包都是基于numpy开发而来，比如 scikit-learn, SciPy, pandas, 还有 tensorflow。 numpy可以处理表格、图像、文本等数据，极大地方便我们处理和分析数据。本文主要内容来自于Jay Alammar的一篇文章以及自己学习记录。
原文地址： https://jalammar.github.io/visual-numpy/

使用过程中，如果希望 Numpy 能创建并初始化数组的值， Numpy 提供了 ones()、zeros() 和 random.random() 等方法。只需传递希望生成的元素数量（大小）即可：

还可以进行如下操作：

一般，需要数组和单个数字之间也可以进行运算操作（即向量和标量之间的运算）。比如说 data * 1.6 ，numpy利用一个叫做广播机制（broadcasting）的概念实现了这一运算。：

我们可以通过索引对numpy数据获取任意位置数据或者对数据切片

我们可以通过numpy自带的函数对数据进行一些想要的聚合计算，比如min、max 和 sum ，还可以使用 mean 得到平均值，使用 prod 得到所有元素的乘积，使用 std 得到标准差等等。

上述操作不仅可以应用于单维度数据，还可以用于多维度数据{（矩阵）。

同样可以使用ones()、zeros() 和 random.random()创建矩阵，只要写入一个描述矩阵维数的元组即可：

numpy还可以处理更高维度的数据：

创建更高维度数据只需要在创建时，在参数中增加一个维度值即可：

根据数组中数值是否满足条件，输出为True或False.

希望得到满足条件的索引，用np.where函数实现.

根据索引得到对应位置的值.

np.where也可以接受另两个可选择的参数a和b。当条件满足时，输出a，反之输出b.

获取数组最大值和最小值的索引可以使用np.argmax和np.argmin.

1、numpy.tofile()和numpy.fromfile()
保存为二进制格式，但是不保存数组形状和数据类型，即都压缩为一维的数组，需要自己记录数据的形状，读取的时候再reshape.

2、numpy.save() 和 numpy.load()
保存为二进制格式，保存数组形状和数据类型，不需要进行reshape
实例：

3、numpy.savetxt()和numpy.loadtxt()

np.savetxt(fname,array,fmt=’%.18e’,delimiter=None)
Parameter解释：
array:待存入文件的数组。
fmt:写入文件的格式
实例：

㈡ python(pandas模块)

1.什么是pandas? numpy模块和pandas模块都是用于处理数据的模块。 numpy主要用于针对数组进行统计计算,处理数字数据比较方便。 pandas除了可以处理数字数据,还可...

㈢ python基础2：随机数生成—random模块、numpy中的random函数

在Python中可以用于随机数生成的有两种主要途径，一是random模块，另一个是numpy库中random函数。

在我们日常使用中，如果是为了得到随机的单个数，多考虑random模块；如果是为了得到随机小数或者整数的矩阵，就多考虑numpy中的random函数,当然numpy也可以的到随机的单个数

一、random模块
二、numpy库中random函数

random模块中将近有7个函数都是可以用来生成随机数的:

作用：随机生成一个 [0,1) 的浮点数

作用：随机生成一个 [a,b) 的浮点数

作用：随机生成一个 [a,b] 的整数

作用：从列表，元组，字符串、集合（可用于for循环的数据类型）中随机选择一个元素

作用：在生成的<以a为始，每step递增，以b为终>这样的一个整数序列中随机选择一个数

作用：打乱一个列表的元素顺序

从序列population中随机取出k个数；population的类型可以是列表、元组、集合、字符串；

在Numpy库中，常用使用np.random.rand()、np.random.randn()和np.random.randint()随机函数。

作用：返回一个或一组服从标准正态分布的随机样本值

备注：标准正态分布是以0为均数、以1为标准差的正态分布，记为N（0，1）。对应的正态分布曲线如下所示，即

作用：使用方法与np.random.randn()函数相同，通过本函数可以返回一个或一组服从“0~1”均匀分布的随机样本值。随机样本取值范围是[0,1)，不包括1

numpy.random.randint(low, high=None, size=None, dtype='l')
输入：
low—–为最小值
high—-为最大值
size—–为数组维度大小
dtype—为数据类型，默认的数据类型是np.int。

作用：返回随机整数或整型数组，范围区间为[low,high），包含low，不包含high； high没有填写时，默认生成随机数的范围是[0，low

np.random.random([size])
作用：生成[0,1)之间的浮点数,与np.random.rand()功能类似

np.random.choice(a,[ size, replace, p])

参考文档1：【python】numpy之random库简单的随机数据生成.rand()、.randint()、.randn()、.random()等（一）
参考文档2： Python中随机数的生成
参考文档3： numpy.random模块常用函数

终于写完了，我以为它很简单的………………预计1小时，结果写了2.5小时

㈣ python中怎样安装numpy模块

1.在python官网https://pypi.python.org/pypi/numpy中找到安装的python版本对应的numpy版本。

例如：

python版本是

㈤ python数据分析模块：numpy、pandas全解

一维数组情况：

二维数组情况：

3参数情况：

2参数情况：

1参数情况：

一维情况：

二维情况：

一维情况：

二维情况：

一维情况：

二维情况：第三个参数指定维度

只查看行数、或者列数

逗号隔开两个索引

某些行

某些列

可以看出append()函数在二维数组中添加元素，结果转为了一维数组。

那怎么保持二维数组呢？可以设置axis参数按行或者按列添加

可以看出先把二维数组降成了一维数组，再在索引为1的位置添加元素。

那么怎么保持在二维添加元素呢？ 同样设置axis参数

也分按行和按列删除

标记缺失值： isnan()函数

补充缺失值：

同样axis参数可以指定拼接按行还是按列

2. hstack()函数：以水平堆叠的方式拼接数组

3. vstack()函数：以垂直堆叠的方式拼接数组

第二个参数还可以是数组，指定拆分的位置

hsplit()函数：横向拆成几个数组

vsplit()函数：纵向拆成几个数组

数组与数组之间的运算

数组与数值的运算

可以指定整个数组求和，还是按行或者按列

axis=0：每一列的元素求和

axis=1：每一行的元素求和

axis=0：每一列求均值

axis=1：每一行求均值

axis=0：每一列求最大值

axis=1：每一行求最大值

pandas有两个重要的数据结构对象：Series和DataFrame。

Series是创建一个一维数组对象，会自动生成行标签。

会自动生成行列标签

也可以用字典形式生成数据

在用字典生成数据的基础上，同时指定行标签

例如对下表的数据进行读取

4月是第四个表，我们应把sheet_name参数指定为3；因为索引是从0开始的。

可以看出read_excel()函数自动创建了一个DataFrame对象，同时自动把第一行数据当做列标签。

可以看出不给出header参数时，该参数默认为0。

header=1时结果如下：

header=None时结果如下：

index_col=0时，第0列为列标签

index_col=0时

usecols=[2]：指定第二列

指定多列

数据如下：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-j1SHxY8y-1637655972909)(C: ypora-user-imagesimage-20211114192949607.png)]

nrows=3时

head()函数中参数为空默认前5行

指定head(3)时如下

numpy模块也是shape

查看特定列的书库类型

特定列数据类型转换

先查看一下所有数据

与单行相比，结果显示的格式不一样了

iloc()挑选：

或者给出区间

挑选数据要么标签，要么索引挑选

或者

或者写成区间

标签挑选

或者索引挑选

先查看一下数据

或者用字典一对一修改

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-a6QKIoie-1637655972912)(C: ypora-user-imagesimage-20211123110431201.png)]

isin()函数查看表中是否有该值

查看特定列是否有该值

可以看出上述代码并没有替换，那怎么替换呢？

末尾插入一列

指定插入到哪列

axis参数可以指定删除行还是删除列

指定标签删除

指定索引删除

方法三

指定行标签删除

指定索引删除

方法三：

先查看所有数据

info()函数查看数据类型，还可以查看是否有缺失值

isnull()函数查看是否有缺失值

在numpy模块中用isnan()函数

删除有缺失值的行

删除整行都为缺失值的行： 需要指定how参数

不同列的缺失值设置不同的填充值

默认保留第一个重复值所在的行，删除其他重复值所在的行

保留第一个重复值所在的行

保留最后一个重复值所在的行

是重复的就删除

降序如下

参数指定first时，表示在数据有重复值时，越先出现的数据排名越靠前

获取产品为单肩包的行数据

获取数量>60的行数据

获取产品为单肩包且数量>60 的行数据

获取产品为单肩包或数量>60 的行数据

stack()函数转换成树形结构

how参数指定外连接

on参数指定按哪一列合并

concat()函数采用 全连接 的方式，没有的数设置为缺失值

重置行标签

效果与concat()一样

末尾添加行元素

指定列求和

指定列求均值

指定列求最值

获取单列的

corr()函数获取相关系数

获取指定列与其他列的相关系数

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-46g9qgQw-1637655972913)(C: ypora-user-imagesimage-20211123135643804.png)]

groupby()函数返回的是一个DataFrameBy对象，该对象包含分组后的数据，但是不能直观地显示出来。

分组后获取指定列的汇总情况

获取多列的汇总情况

获取多列的情况

ta = pd.read_excel(‘相关性分析.xlsx’)

print(data)

corr()函数获取相关系数

获取指定列与其他列的相关系数

[外链图片转存中…(img-46g9qgQw-1637655972913)]

groupby()函数返回的是一个DataFrameBy对象，该对象包含分组后的数据，但是不能直观地显示出来。

分组后获取指定列的汇总情况

获取多列的汇总情况

获取多列的情况

㈥ Python,的numpy模块中有没有阶乘函数

有阶乘函数，Numpy中，mat必须是2维的,但是array可以是多维的（1D，2D，3D····ND）. Matrix是Array的一个小的分支，包含于Array。所以matrix 拥有array的所有特性。

在numpy中matrix的主要优势是：相对简单的乘法运算符号。例如，a和b是两个matrices，那么a*b，就是矩阵积。

若a=mat([1,2,3])是矩阵，则 a.A 则转换成了数组，反之，a.M则转换成了矩阵。

(6)python中的numpy模块扩展阅读：

常用的Numpy运算：

取矩阵中的某一行ss[1,:]或该行的某两列ss[1,0:2]

将数组转换成矩阵randMat=mat(random.rand(4,4))

矩阵求逆randMat.I

单位阵eye(4)

零矩阵zeros((x,y))建立x行y列的零矩阵。

最大值和最小值a.max(),a.min(),而a.max(0)表示按列选取每列的最大值。最大/小元素的下标a.argmax(),a.argmin()

#作为方法x.sum() #所有元素相加x.sum(axis=0) #按列相加x.sum(axis=1) #按行相加#作为函数sum(a,axis=0)ss.mean()

mean(a,axis=0(或1)) #按列或行求均值var(a)var(a,axis=0(或1)) #按列或行求方差。

std(a)std(a,axis=0(或1)) #按列或行求标准差ss.T或ss.transpose() #转置。

㈦ python(pandas模块)

Pandas是Python的一个数据分析包，最初由AQR Capital
Management于2008年4月开发，并于2009年底开源出来，目前由专注于Python数据包开发的Pydata开发team继续开发和维护，属于PyData项目的一部分，pandas最初被作为金融数据分析工具而开发出来，因此pandas为时间序列分析提供了很好的支持。

Pandas的名称来自于面板数据和python数据分析。panel
data是经济学中关于多维数据集的一个术语，在Pandas中也提供了panel的数据类型。

Pandas数据结构：

Series：一维数组，与numpy中的一维array类似。二者与Python基本的数据结构list相近，Series如今能保存不同种数据类型，字符串、boolean值、数字等都能保存在series中。

Time-series：以时间为索引的series。

DataFrame：二维的表格型数据结构，很多功能与R中的data.frame类似，可以将DataFrame理解为Series的容器。

Panel ：三维的数组，可以理解为DataFrame的容器。

Panel4D：是像Panel一样的4维数据容器。

PanelND：拥有factory集合，可以创建像Panel4D一样N维命名容器的模块。

阅读全文

热点内容

java返回this 发布：2025-10-20 08:28:16 浏览：1106

制作脚本网站发布：2025-10-20 08:17:34 浏览：1382

python中的init方法发布：2025-10-20 08:17:33 浏览：1071

图案密码什么意思发布：2025-10-20 08:16:56 浏览：1246

怎么清理微信视频缓存发布：2025-10-20 08:12:37 浏览：1112

c语言编译器怎么看执行过程发布：2025-10-20 08:00:32 浏览：1462

邮箱如何填写发信服务器发布：2025-10-20 07:45:27 浏览：668

shell脚本入门案例发布：2025-10-20 07:44:45 浏览：566

怎么上传照片浏览上传发布：2025-10-20 07:44:03 浏览：1240

python股票数据获取发布：2025-10-20 07:39:44 浏览：1273

python中的numpy模块

与python中的numpy模块相关的资讯