TREC 2006 Spam Track Public Corpus
----
INSTRUCTIONS
1. The compressed file may be uncompressed with gzip, Winzip,
or any other utility that understands gzip format.
2. The compressed file will unpack to a folder named trec06
3. There is one main corpus with four subsets:
trec06/full -- the main corpus with messages (37822
messages; 12910 ham, 24912 spam)
trec06/ham25 -- subset of full: 100% of spam, 25% of ham
trec06/ham50 -- subset of full: 100% of spam, 50% of ham
trec06/spam25 -- subset of full: 25% of spam, 100% of ham
trec06/spam50 -- subset of full: 50% of spam, 100% of ham
4. There is a delayed-feedback version of each:
run.sh trec06/full-delay/
run.sh trec06/ham25-delay/
run.sh trec06/ham50-delay/
run.sh trec06/spam25-delay/
run.sh trec06/spam50-delay/
5. Corpus is compatible with "TREC Spam Filter Evaluation Toolkit"
using the commands:
run.sh trec06/full/
run.sh trec06/ham25/
run.sh trec06/ham50/
run.sh trec06/spam25/
run.sh trec06/spam50/
run.sh trec06/full-delay/
run.sh trec06/ham25-delay/
run.sh trec06/ham50-delay/
run.sh trec06/spam25-delay/
run.sh trec06/spam50-delay/
梦因you而美
- 粉丝: 608
- 资源: 21
最新资源
- bdwptqmxgj11.zip
- onnxruntime-win-x86
- onnxruntime-win-x64-gpu-1.20.1.zip
- vs2019 c++20 语法规范 头文件 <ratio> 的源码阅读与注释,处理分数的存储,加减乘除,以及大小比较等运算
- 首次尝试使用 Win,DirectX C++ 中的形状渲染套件.zip
- 预乘混合模式是一种用途广泛的三合一混合模式 它已经存在很长时间了,但似乎每隔几年就会被重新发现 该项目包括使用预乘 alpha 的描述,示例和工具 .zip
- 项目描述 DirectX 引擎支持版本 9、10、11 库 Microsoft SDK 功能相机视图、照明、加载网格、动画、蒙皮、层次结构界面、动画控制器、网格容器、碰撞系统 .zip
- 项目 wiki 文档中使用的代码教程的源代码库.zip
- 面向对象的通用GUI框架.zip
- 基于Java语言的PlayerBase游戏角色设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈