没有合适的资源?快使用搜索试试~ 我知道了~
mergic:工作流支持可重复数据删除和合并
共22个文件
py:5个
json:4个
csv:3个
需积分: 8 0 下载量 55 浏览量
2021-05-23
13:56:25
上传
评论
收藏 7.65MB ZIP 举报
温馨提示
悲观的 工作流支持可重复数据删除和合并 假设您有一堆字符串,其中一些是不同的,但指的是同一件事。 也许只是一长串的清单,也许是您要合并的数据集中的两个关键列的内容。 David Copperfield Lance Burton Dave Copperfield Levar Burton 这是您可以使用mergic : 给mergic所有的标识符,每行一个。 如果它们在一个名为originals.txt的文件中: mergic calc originals.txt 您将看到有关mergic根据其默认距离函数可能产生的分组的输出。 (使用自定义距离功能很容易,请参见下文。) num groups, max group, num pairs, cutoff ---------------------------------------- 4, 1,
资源推荐
资源详情
资源评论
收起资源包目录
mergic-master.zip (22个子文件)
mergic-master
.travis.yml 245B
README.rst 8KB
RLdata
RLdata500dupes.csv 3KB
RLdata500.R 612B
README.md 53B
RLdata500.csv 13KB
tennis
rebuilt.json 26KB
merge.csv 19KB
diff.json 3KB
Tennis-Major-Tournaments-Match-Statistics.zip 47KB
groups.json 26KB
requirements.txt 43B
tennis_mergic.py 399B
.mergic_cache 26.42MB
README.md 8KB
edited.json 26KB
names.txt 25KB
setup.py 870B
.gitignore 237B
mergic
test.py 4KB
__init__.py 87B
mergic.py 15KB
共 22 条
- 1
资源评论
婉君喜欢DIY
- 粉丝: 13
- 资源: 4617
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于opencv+yolov8实现目标追踪及驻留时长统计源码.zip
- 水稻病害基于Yolov8算法优化目标检测识别与AI辅助决策python源码+模型+使用说明.zip
- 海尔618算价表_七海5.20_16.00xlsx(1)(2).xlsx
- WebCrawler.scr
- 【计算机专业毕业设计】大学生就业信息管理系统设计源码.zip
- YOLO 数据集:8种路面缺陷病害检测【包含划分好的数据集、类别class文件、数据可视化脚本】
- JAVA实现Modbus RTU或Modbus TCPIP案例.zip
- 基于YOLOv8的FPS TPS AI自动锁定源码+使用步骤说明.zip
- JAVA实现Modbus RTU或Modbus TCPIP案例.zip
- 基于yolov8+streamlit的火灾检测部署源码+模型.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功