没有合适的资源?快使用搜索试试~ 我知道了~
est:大量数据的快速基数和TopK估计的Shell程序
共8个文件
java:3个
gitignore:1个
license:1个
需积分: 10 0 下载量 119 浏览量
2021-07-03
10:36:33
上传
评论
收藏 6KB ZIP 举报
温馨提示
美东时间。 美东时间。 代表估计。 它是一个 Unix shell 程序,用于估计输入的基数和流的重击者。 如果您正在处理大量文本数据并且需要估计文件或某个程序的输出中有多少唯一行,您肯定会发现它很有用。 你什么时候需要它? cat file | sort | uniq | wc -l cat file | sort | uniq | wc -l – 获取文件中唯一行数的最简单方法。 但是有一个问题。 即, sort 。 当文件中有数千万,有时甚至数百万行时,排序就变得太昂贵了。 如果您可以用精度换取速度,那么est实用程序适合您。 安装 est实用程序需要 Java 1.6 或更高版本。 只需在您的 shell 中运行 fillowing 命令: curl -s https://raw.githubusercontent.com/bazhenov/est/master/inst
资源推荐
资源详情
资源评论
收起资源包目录
est-master.zip (8个子文件)
est-master
install.sh 218B
src
main
java
me
bazhenov
est
App.java 1KB
UniqCommand.java 934B
TopCommand.java 2KB
LICENSE 1KB
README.md 2KB
pom.xml 2KB
.gitignore 14B
共 8 条
- 1
资源评论
曲奇小朋友
- 粉丝: 18
- 资源: 4575
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功