没有合适的资源?快使用搜索试试~ 我知道了~
tech.ml.dataset:Clojure高性能数据处理系统
共169个文件
clj:74个
html:26个
csv:16个
需积分: 5 0 下载量 154 浏览量
2021-02-01
16:03:20
上传
评论
收藏 1.34MB ZIP 举报
温馨提示
tech.ml.dataset tech.ml.dataset是用于数据处理和机器学习的Clojure库。 数据集目前是内存中的列式数据库,我们支持从文件或输入流进行解析。 我们支持以下格式:原始/压缩后的csv / tsv,xls,xlsx,json和映射序列作为输入源。 作为单独的库提供。 内存中的数据大小(原始数组),日期时间类型通常转换为整数表示形式,并且将字符串加载到字符串表中。 这些功能一起极大地减少了内存中的工作集大小。 由于数据以列形式存储,因此对数据集的列操作非常快。 转换回地图序列非常有效,我们支持将数据集写回给csv,tsv和gzip压缩的数据集。 升级了对支持。 我们使用标准api支持复制途径-数据从磁盘复制到缓冲区中。 我们还支持就地构建路径,该路径明确构建为支持大于机器RAM的两个数据集,并纯粹出于命名空间的性能考虑。 通过可以使用具有一些重要附加功能的替代性尖端api。 简单的回归/分类机器学习途径可在中。 即使使用与Parquet该死的速度也很快。 迷你演练 user> ( require '[tech.v3.dataset :as ds])
资源推荐
资源详情
资源评论
收起资源包目录
tech.ml.dataset:Clojure高性能数据处理系统 (169个子文件)
activate-graal 50B
with_date.arrow 1KB
dataset_test.clj 38KB
parquet.clj 36KB
base.clj 31KB
dataset.clj 31KB
join.clj 21KB
column_parsers.clj 20KB
tensor.clj 18KB
ames_test.clj 17KB
math.clj 17KB
copying.clj 17KB
column.clj 17KB
dataset.clj 17KB
in_place.clj 14KB
reductions.clj 14KB
parse_test.clj 14KB
datatype.clj 13KB
join_test.clj 13KB
univocity.clj 13KB
io.clj 11KB
missing.clj 10KB
categorical.clj 10KB
data.clj 9KB
mapseq_test.clj 9KB
print.clj 9KB
modelling.clj 8KB
arrow_test.clj 8KB
spark.clj 8KB
datetime.clj 6KB
project.clj 6KB
format_sequence.clj 6KB
column.clj 6KB
math_test.clj 5KB
schema.clj 5KB
string_table.clj 5KB
poi.clj 5KB
dynamic_int_list.clj 4KB
column_filters.clj 4KB
fastexcel.clj 4KB
parquet_test.clj 4KB
format_sequence_test.clj 4KB
context.clj 3KB
string_row_parser.clj 3KB
poi_test.clj 3KB
mapseq_colmap.clj 3KB
file_backed_text.clj 3KB
svm.clj 3KB
column_base.clj 3KB
column_data_process.clj 3KB
spreadsheet.clj 3KB
datetime_test.clj 2KB
fastexcel_test.clj 2KB
readers.clj 2KB
utils.clj 2KB
neanderthal.clj 2KB
arrow.clj 2KB
reductions_test.clj 2KB
column_tests.clj 2KB
update_columns_test.clj 1KB
unpack_larray.clj 1KB
nettoolkit.clj 1KB
column.clj 1KB
data_test.clj 1KB
github_test.clj 1KB
nippy.clj 1KB
neanderthal_test.clj 1KB
allocator.clj 1KB
object_columns_test.clj 1KB
dataset.clj 1KB
test_utils.clj 1013B
modelling_test.clj 911B
main.clj 820B
parallel_unique.clj 763B
slf4j_log_level.clj 665B
missing_values.clj 41B
default.css 9KB
solarized-light.css 1KB
BPD_Call_Log.csv 2.9MB
seattle-temps.csv 265KB
medical-text.csv 167KB
double_parse_test.csv 51KB
stocks.csv 12KB
sample01.csv 4KB
essential-dos.csv 843B
essential.csv 821B
essential-mac.csv 821B
stocks-bad-date.csv 639B
datatype_parser.csv 492B
rcsv.csv 188B
ragged.csv 170B
iterating_test.csv 48B
ip-addrs.csv 44B
test.csv 13B
config.edn 46B
stocks.pyarrow.feather 6KB
iris.feather 6KB
get-graal 325B
get-taxi-data 380B
.gitignore 233B
共 169 条
- 1
- 2
资源评论
皮卡学长
- 粉丝: 76
- 资源: 4622
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功