没有合适的资源?快使用搜索试试~ 我知道了~
datacompy:熊猫与Spark DataFrame的人类比较
共32个文件
py:8个
txt:6个
rst:6个
需积分: 49 3 下载量 105 浏览量
2021-05-01
00:16:01
上传
评论
收藏 53KB ZIP 举报
温馨提示
数据通讯 DataComPy是一个用于比较两个Pandas DataFrame的程序包。 最初开始是SAS的PROC COMPARE for Pandas DataFrame的替代品,其功能不仅仅是Pandas.DataFrame.equals(Pandas.DataFrame) (因为它可以打印出一些统计信息,并让您调整必须精确匹配的数量) )。 然后扩展以将该功能传递给Spark Dataframes。 快速安装 pip install datacompy 熊猫细节 DataComPy将尝试在连接列列表或索引上连接两个数据框。 如果两个数据框具有基于联接值的重复项,则匹配过程将按其余字段排序,并根据该行号联接。 按列比较会尝试匹配值,即使dtypes不匹配也是如此。 因此,例如,如果您在一个数据帧中有一列具有decimal.Decimal值,而在另一个数据帧中具有一个decimal.
资源推荐
资源详情
资源评论
收起资源包目录
datacompy-develop.zip (32个子文件)
datacompy-develop
datacompy
_version.py 614B
__init__.py 733B
core.py 29KB
templates
column_summary.txt 155B
fav_column_summary.txt 235B
header.txt 80B
row_summary.txt 359B
column_comparison.txt 205B
sparkcompare.py 34KB
.gitignore 204B
setup.cfg 109B
README.rst 10KB
.github
workflows
python-package.yml 3KB
.pre-commit-config.yaml 255B
tests
test_core.py 38KB
test_sparkcompare.py 67KB
docs
source
developer_instructions.rst 4KB
conf.py 2KB
index.rst 445B
pandas_usage.rst 9KB
spark_usage.rst 7KB
install.rst 710B
.nojekyll 0B
Makefile 875B
LICENSE 11KB
CODEOWNERS 35B
.whitesource 138B
requirements.txt 29B
MANIFEST.in 60B
CONTRIBUTORS 71B
setup.py 1KB
Makefile 274B
共 32 条
- 1
资源评论
佐罗先生
- 粉丝: 34
- 资源: 4750
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功