聚类
第六章示例代码。
数据
本章利用了Reuters-21578文本分类测试集。 更多信息,。
数据集可直接从下载。
指示
* nix和OS X
运行以下命令行脚本,将数据下载到项目的数据目录中:
# Downloads and unzips the data files into this project's data directory.
script/download-data.sh
Windows /手册说明
下载上面链接的.tar.gz文件。
将文件的内容扩展到该项目目录内名为data / reuters-sgml的目录
完成这些步骤后,data / reuters-sgml目录中应该有许多.sgm文件。
运行示例
可以使用以下示例运行:
# Replace 6.1 with the example you want to run:
lein run -e