没有合适的资源?快使用搜索试试~ 我知道了~
pyjanitor:清理用于数据清理的API。 R包Janitor的Python实现
共251个文件
py:125个
md:21个
rst:21个
需积分: 10 1 下载量 167 浏览量
2021-04-28
21:33:29
上传
评论
收藏 5.36MB ZIP 举报
温馨提示
pyjanitor pyjanitor是R包的Python实现,并提供用于清除数据的clean API。 为什么要看门人? pyjanitor最初是R程序包的一个端口,已从一组便捷的数据清理例程演变为使用范式的实验。 数据预处理通常由一系列步骤组成,这些步骤涉及将原始数据转换为可理解/可用的格式。 这些步骤系列必须按一定顺序运行才能取得成功。 我们以基本数据文件为起点,并对它执行操作,例如删除空/空行,将其替换为其他值,添加/重命名/删除数据列,过滤行等。 更正式地讲,这些步骤以及它们之间的关系和依赖性通常称为有向无环图(DAG)。 pandas API对于Python数据科学生态系统而言是无价的,并且作为API的一部分实现了方法子集的方法链接。 例如,通过适当的pd.DataFrame方法调用可以完成重置索引( .reset_index() ),删除空值( .dropna()
资源推荐
资源详情
资源评论
收起资源包目录
pyjanitor:清理用于数据清理的API。 R包Janitor的Python实现 (251个子文件)
make.bat 813B
.bumpversion.cfg 134B
medium_franchise_raw_table.csv 8KB
.darglint 79B
Dockerfile 2KB
sequences.fasta 9.49MB
.gitignore 2KB
docs.in 127B
all.in 102B
base.in 98B
testing.in 77B
MANIFEST.in 75B
chemistry.in 70B
dev.in 65B
biology.in 10B
spark.in 8B
engineering.in 5B
pytest.ini 499B
normalize.ipynb 437KB
Pivoting Data from Wide to Long.ipynb 202KB
french_trains.ipynb 174KB
slides.ipynb 127KB
board_games.ipynb 83KB
pyjanitor_intro.ipynb 81KB
anime.ipynb 64KB
medium_franchise.ipynb 52KB
dirty_data.ipynb 36KB
bird_call.ipynb 22KB
bad_values.ipynb 20KB
teacher_pupil.ipynb 16KB
expand_grid.ipynb 14KB
groupby_agg.ipynb 11KB
Row_to_Names.ipynb 8KB
sort_naturally.ipynb 8KB
inflating_converting_currency.ipynb 7KB
transform_column.ipynb 7KB
sprints.jpg 1.27MB
devcontainer.json 1KB
LICENSE 1KB
Makefile 1KB
Makefile 608B
CHANGELOG.md 12KB
make_currency_column_numeric.md 7KB
filter_date.md 4KB
add_column.md 3KB
round_to_fraction.md 3KB
then.md 3KB
convert_currency.md 3KB
row_to_names.md 2KB
limit_column_characters.md 2KB
pull_request_template.md 2KB
new_proposed_feature.md 1KB
bug_report.md 946B
documentation_fix.md 778B
new_examples.md 546B
slides.md 306B
janitor.currency_column_to_numeric.md 149B
janitor.convert_excel_date.md 123B
janitor.find_replace.md 103B
janitor.add_columns.md 100B
janitor.filter_on.md 94B
janitor.get_dupes.md 94B
friends.png 1.52MB
twitter-wars.png 355KB
add_env.png 290KB
click_add.png 218KB
project_interpreter.png 215KB
preferences.png 201KB
readthedocs.png 155KB
functions.py 192KB
utils.py 67KB
test_pivot_longer.py 65KB
date_data.py 40KB
test_pivot_wider.py 22KB
test_complete.py 22KB
finance.py 20KB
nbconvert_config.py 20KB
test_flag_jumps.py 18KB
timeseries.py 14KB
chemistry.py 13KB
test_encode_categorical.py 12KB
test_process_text.py 10KB
test__select_column.py 10KB
test_expand_grid.py 8KB
conf.py 7KB
math.py 6KB
functions.py 5KB
test_clean_names.py 5KB
test_inflate_currency.py 5KB
functions.py 4KB
test_fill_direction.py 4KB
test_unionize_dataframe_categories.py 4KB
setup.py 4KB
test_read_csvs.py 4KB
test_deconcatenate_column.py 4KB
test_select_columns.py 4KB
test_add_column.py 4KB
test_jitter.py 3KB
conftest.py 3KB
engineering.py 3KB
共 251 条
- 1
- 2
- 3
资源评论
pangchenghe
- 粉丝: 35
- 资源: 4534
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- IPv6和ICMPv6等
- Módulo I da Trilha“JavaScript 开发人员”参考资料库 .zip
- MyBatis 3 的 Spring 集成.zip
- LibRec领先的推荐系统 Java 库,请参阅.zip
- 修改LATEX.pdf
- IMG_20241125_120800.jpg
- AI助手Copilot辅助Go+Flutter打造全栈式在线教育系统课程17章
- AssetStudioGUI官方版是一款简易实用,功能全面的图像处理软件,AssetStudioGUI官方版能够提取游戏中的立绘和动画资源的工具,且功能非常全面,支持动画的导出,是动画制作人员得力的助
- 2024下半年,CISSP官方10道练习题
- JD-Core是一个用JAVA编写的JAVA反编译器 .zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功