没有合适的资源?快使用搜索试试~ 我知道了~
1、数据分组–>频数分布表 环境配置: import pandas as pd import numpy as np import matplotlib.pyplot as plt 按照你设定合适的间隔,把数据分为各个范围的组,然后统计出在这个范围内的频数有多少,我没有找到合适的函数,我就自己写了一个函数,类似直方图的工作,这是画水平条形图的数据准备。至于为什么要画水平条形图,当类别太多,使用水平条形图比较简洁,个人看法。下面给出代码,就不解释代码含义了。 def data_count(dataa, r1, r2, step): r = pd.DataFrame(np.random.ra
资源推荐
资源详情
资源评论
python实现读取类别频数数据画水平条形图案例实现读取类别频数数据画水平条形图案例
1、数据分组、数据分组–>频数分布表频数分布表
环境配置:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
按照你设定合适的间隔,把数据分为各个范围的组,然后统计出在这个范围内的频数有多少,我没有找到合适的函数,我就自
己写了一个函数,类似直方图的工作,这是画水平条形图的数据准备。至于为什么要画水平条形图,当类别太多,使用水平条
形图比较简洁,个人看法。下面给出代码,就不解释代码含义了。
def data_count(dataa, r1, r2, step):
r = pd.DataFrame(np.random.randn(1, 2))
r.drop(0, inplace=True)
while r1+step <= r2:
num = 0
for j in range(len(dataa)):
if dataa[j] >= r1 and dataa[j] < r1+step:
num = num + 1
f = "%s~%d" % (r1, r1+step)
# r = r.append([[int(r1), num], ]) # 使用单数表示
r = r.append([[f, num], ]) # 使用范围表示
r1 = r1 + step
return r
要注意的数据范围只包含上界不含下界,数据公式这样子1⩽data<5,只含上界,这样就可以做出不重不漏。
2、频数计算、频数计算
这是运用data_count函数(上面代码)进行频数计算的演示,首先看一下原数据长什么样,暂时麻烦就不公布了,你们自己按
照自己的数据决定。
测试data_count函数代码:
data_gap1 = data_count(g11[:], 1, 51, 1)
data_gap2 = data_count(g22[:], 1, 51, 1)
很简单啦,就是函数的调用,你们都会的,给大家看一下输出结果,如下图:
资源评论
weixin_38747233
- 粉丝: 8
- 资源: 969
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功