没有合适的资源?快使用搜索试试~ 我知道了~
RiskTables:使用 a) 一个简单的 Python 脚本和 b) 用 Scala 编写的 Spark 应用程序从 csv...
共5个文件
py:1个
md:1个
sbt:1个
需积分: 5 0 下载量 58 浏览量
2021-06-10
10:26:05
上传
评论
收藏 5KB ZIP 举报
温馨提示
风险表 使用 python 脚本从 csv 生成平滑的风险表 示例数据 = input.csv 格式 = 欺诈/非欺诈(分别为 1,0),类别(范围为 0-4) Script = risk.py - 从 STDIN 读取 CSV 数据并将数据写入 STDOUT,并附加风险。 用法 = > ./risk.py SMOOTH < input.csv ,其中 SMOOTH 是可选的平滑参数(默认值=50)。 较高的平滑参数将使小类别的风险更接近于零。 尝试将参数设置为希望平滑有效的类别中最少的观察数。 在 SMOOTH=0 时,表默认为简单风险。 在脚本中,有一个详细的标志集 =0。 如果要显示风险表值,请将其更改为 1。 编写脚本是为了同时计算附加字段的风险。 需要两次通过数据:一次用于存储计数,然后另一次用于将风险分配给输出记录。 如果您只是想创建风险表,则只需通过一次。 注意:
资源推荐
资源详情
资源评论
收起资源包目录
RiskTables-master.zip (5个子文件)
RiskTables-master
README.md 2KB
RiskTable.scala 2KB
input.csv 16KB
risk.py 994B
simple.sbt 214B
共 5 条
- 1
资源评论
KINSLAUGHTER
- 粉丝: 29
- 资源: 4758
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功