## pandas EDA
Big Data? Machine Learning?
You work with your data -
Manipulating it, merging, pivot and more.
But what happened in between? Did you get a lot of nans? Maybe duplicated values?
You constantly need to check your data status,
But you cannot do values_counts, isna and all those stuffs every second...
**pandas_eda** is an **Exploratory Data Analysis** tool that will show you status and frequent values for each column!
You will be focused on what you have on the spot.
**Demo** is the best way to understand:
[![demo](https://github.com/lisrael1/pandas_eda/blob/master/front.jpg?raw=True)](https://youtu.be/kHT6MshXb04)
**install:**
```shell
pip install pandas_eda
```
**usage:**
```python
import pandas as pd
import pandas_eda
from time import sleep
# dummy data
df = pd._testing.makeMixedDataFrame()
# or your data...
# df = pd.read_excel('whatever.xlsx')
# show original data
df.eda() # can use this at debug mode too!
# manipulation #1
df.A += 10
df.eda() # yes, you can open multiple EDA windows!
# manipulation #2
df.loc[df.B==1, 'A'] -= 30
df.eda()
sleep(600) # just that ending script will end the eda too, so delaying the exit. no need at jupyter
```
**note:**
If you're running on remote machine, the eda will be opened on the remote...
**alternatives:**
After starting this tool I've found 2 cool alternatives:
* [sweetviz](https://pypi.org/project/sweetviz)
<ul>Has a nice interactive report.</ul>
* [mito](https://www.trymito.io/)
<ul>Great for new table that needs also cleaning.<br>
Works only at jupyter.</ul>
没有合适的资源?快使用搜索试试~ 我知道了~
pandas_eda-0.7.0.tar.gz
0 下载量 47 浏览量
2024-03-12
18:23:00
上传
评论
收藏 7KB GZ 举报
温馨提示
Python库是一组预先编写的代码模块,旨在帮助开发者实现特定的编程任务,无需从零开始编写代码。这些库可以包括各种功能,如数学运算、文件操作、数据分析和网络编程等。Python社区提供了大量的第三方库,如NumPy、Pandas和Requests,极大地丰富了Python的应用领域,从数据科学到Web开发。Python库的丰富性是Python成为最受欢迎的编程语言之一的关键原因之一。这些库不仅为初学者提供了快速入门的途径,而且为经验丰富的开发者提供了强大的工具,以高效率、高质量地完成复杂任务。例如,Matplotlib和Seaborn库在数据可视化领域内非常受欢迎,它们提供了广泛的工具和技术,可以创建高度定制化的图表和图形,帮助数据科学家和分析师在数据探索和结果展示中更有效地传达信息。
资源推荐
资源详情
资源评论
收起资源包目录
pandas_eda-0.7.0.tar.gz (13个子文件)
pandas_eda-0.7.0
setup.py 1KB
src
pandas_eda
__init__.py 630B
explore.py 6KB
streamlit_app.py 4KB
pandas_eda.egg-info
SOURCES.txt 300B
top_level.txt 11B
PKG-INFO 2KB
requires.txt 49B
dependency_links.txt 1B
LICENSE 1KB
PKG-INFO 2KB
setup.cfg 42B
README.md 2KB
共 13 条
- 1
资源评论
程序员Chino的日记
- 粉丝: 3715
- 资源: 5万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功