已知数据集
Knowm Datasets是一个Java库,可方便地使用机器学习数据集。
描述
这个开源项目的原理很简单-提取几个不同的数据集,它们都有自己的自定义格式,然后使用访问数据的统一API将它们全部转换为统一格式。 每个模块都有RawData2DB类,该类分析原始数据并将每个数据对象放入基于文件的HSQLDB数据库中。 无需单独安装数据库。 生成的数据库文件已在上传到Knowm的Google云端硬盘帐户。 客户端应用程序通过DAO类访问数据,其方法非常简单,甚至一个孩子也可以理解:
样例代码:
LSHTC4DAO.init("/Users/timmolter/Documents/Datasets"); // setup data
// print number of objects
long count = LSHTC4DAO.selectCount();
System.out
评论0
最新资源