# 2022 CCF Web攻击检测与分类识别赛道 线上 94.7 baseline 分享
# 赛道链接:
https://www.datafountain.cn/competitions/596
# 赛题背景:
某业务平台平均每月捕获到Web攻击数量超过2亿,涉及常见注入攻击,代码执行等类型。传统威胁检测手段通过分析已知攻击特征进行规则匹配,无法检测未知漏洞或攻击手法。如何快速准确地识别未知威胁攻击并且将不同攻击正确分类,对提升Web攻击检测能力至关重要。利用机器学习和深度学习技术对攻击报文进行识别和分类已经成为解决该问题的创新思路,有利于推动AI技术在威胁检测分析场景的研究与应用。
# 赛题任务:
参赛团队需要对前期提供的训练集进行分析,通过特征工程、机器学习和深度学习等方法构建AI模型,实现对每一条样本正确且快速分类,不断提高模型精确率和召回率。待模型优化稳定后,通过无标签测试集评估各参赛团队模型分类效果,以正确率评估各参赛团队模型质量。
# baseline 思路
多分类问题,表格 + 文本 类型的题目,可使用传统的 TFIDF 或者 BERT 等方式提取文本信息,结合特征工程来做。
本 baseline 用了 TFIDF + 简单特征工程,五折 LGB 模型,线下 0.98,线上 94.7
没有合适的资源?快使用搜索试试~ 我知道了~
CCF-BDCI-2022赛道:Web攻击检测与分类识别(多分类任务),比赛rank-23。队员:FurenXu.zip
共53个文件
py:21个
csv:11个
ipynb:7个
需积分: 5 2 下载量 60 浏览量
2023-09-30
18:10:29
上传
评论
收藏 92.18MB ZIP 举报
温馨提示
此仓库代码为本人参加的CCF-BDCI-2022赛道:Web攻击检测与分类识别(多分类任务),比赛rank-23。
资源推荐
资源详情
资源评论
收起资源包目录
此仓库代码为本人参加的CCF-BDCI-2022赛道:Web攻击检测与分类识别(多分类任务),比赛rank-23。队员:FurenXu.zip (53个子文件)
CCF-BDCI2022-Web-Attack-Detection-and-Classification-master
EDA
EDA.ipynb 760KB
data
train
目录遍历.csv 62.52MB
SQL注入.csv 46.42MB
XSS跨站脚本.csv 321KB
命令执行.csv 630KB
白.csv 994KB
远程代码执行.csv 2.93MB
test.zip 1.9MB
train.zip 22.64MB
test
test.csv 9.35MB
submit_example.csv 26KB
xgb-baseline
main_w2v.py 9KB
w2v.pkl 56.33MB
main0.py 7KB
main_keyword_feats.ipynb 19KB
main_w2v.ipynb 2.16MB
main_keyword_feats.py 10KB
main0_gridsearch.py 7KB
.idea
misc.xml 288B
inspectionProfiles
Project_Default.xml 17KB
profiles_settings.xml 174B
modules.xml 312B
deployment.xml 573B
Web攻击检测与分类识别.iml 317B
.gitignore 176B
deberta-baseline
main0.py 13KB
tricks.py 4KB
main0.ipynb 60KB
__pycache__
tricks.cpython-37.pyc 4KB
lgb-baseline
main2.py 7KB
main_url.py 10KB
main_body_url_nums.py 10KB
main_all.py 10KB
main_bodylen.py 10KB
main0.py 6KB
baseline-22-9-1.csv 26KB
baseline.ipynb 36KB
main1.py 6KB
main_url_and_len.py 10KB
main_bert.py 9KB
README.md 1KB
main_bodylen.csv 26KB
bert-baseline
main_bert_add_feats.py 16KB
inference_kfold.py 6KB
main0_kfold.ipynb 47KB
main0.py 13KB
inference.py 6KB
tricks.py 4KB
main0.ipynb 46KB
main0_kfold.py 13KB
bert_main.csv 26KB
__pycache__
tricks.cpython-37.pyc 4KB
README.md 1KB
共 53 条
- 1
资源评论
天天501
- 粉丝: 589
- 资源: 4666
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- Qt开发知识、经验总结 包括Qss,数据库,Excel,Model/View等
- IV数据.xlsx
- foldcraftlauncher_262944.apk
- 珍藏多年的基于matlab实现潮流计算程序源代码集合,包含多个潮流计算程序.rar
- 使用FPGA实现串-并型乘法器
- 基于matlab实现针对基于双曲线定位的DV-Hop算法中误差误差出一种基于加权双曲线定位的DV-Hop改进算法.rar
- 基于matlab实现由遗传算法开发的整数规划,车辆调度问题.rar
- 电视家7.0(对电视配置要求高).apk
- 免费计算机毕业设计-基于JavaEE的医院病历管理系统设计与实现(包含论文+源码)
- 手机端 我的世界融合植物大战僵尸版.apk
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功