• 搬砖程序-liveStrategyEngine-master

    搬砖程序-liveStrategyEngine-master,供学习参考。

    0
    168
    64KB
    2019-03-16
    10
  • K近邻、支持向量机两个分类算法

    目前,机器学习牵涉的编程语言十分多样,包括了MATLAB、Julia、R、Perl、Python、Ruby等等。小组内部之前对MATLAB较为熟悉,但考虑到拓展知识面、方便学习等因素,最后选择Python语言。原因包括:Python是解释语言,写程序很方便;Python用途很广,特点是在Web应用方面,以后可以方便地扩展到其它应用用途;用Python开发比较快,Python提供了NumPy、Theano、scikit-learn、matplotlib等强大的机器学习程序包;Python的效率不差;使用广泛,存在大量的开发文档等。 为了能够把精力集中在机器学习本身上,小组直接选了,在Windws操作系统上,利用anaconda的spyder开发环境,其理由为方便、简单。 学习《Python3程序开发指南.第二版》,学习Python程序开发,并了解NumPy、Theano、scikit-learn、matplotlib等程序包。

    0
    0
    208KB
    2017-03-18
    10
  • 文档主题的半监督分类问题-pyhon-机器学习

    打开网站链接http://archive.ics.uci.edu/ml/,点击链接 view all data sets,打开所有数据页面,点击Instances,按照研究实例由多到少排序,我们小组选择了“Bag of Words Data Set”单词袋子的形式文本数据集。 本次作业解决问题具体化为:文档主题的半监督分类问题。 二、数据分析 (一)认识数据 数据集描述:对于每个文本数据集,D文档的数量,W是文档字典集中单词数量,N是数据中所有单词数量(NNZ为非零数据的数量),在分词器、去无用词之后,去重字典。 Bag of Words Data Set数据集网站提供了两个,这里我们选择数量较小的一组“mini_newsgroups”,该数据共包括20个分类,其中每个类包括100个文档,共包括2000个文档。

    0
    210
    770KB
    2017-03-18
    31
  • 机器学习字母分类-python

    打开网站链接http://archive.ics.uci.edu/ml/,点击链接 view all data sets,打开所有数据页面,点击Instances,按照研究实例由多到少排序,选择任务为Classification的数据集,最后我们小组选择了“Letter Recognition Data Set”字母识别数据集。 二、数据分析 字母识别数据集每个对象有16个特征,共包括20000个数据对象,每个特征的取值都为整数,于1991年1月1日提供,主要用来进行数据分类试验。分类的目标是识别由黑白像素组成矩形的图像,代表26英文字母哪个字母。这些图像基于20种不同字体,并经过随机变形生成的20000个模拟实例。每个实例转化成16个原始数字特征,其中10000用于训练,另外10000个用于字母预测。因为每个样本都有明确的类标识,所以这个一个监督学习过程。

    0
    602
    210KB
    2017-03-18
    50
关注 私信
上传资源赚积分or赚钱