# Stock-prediction-algorithm-based-on-machine-learning
## 使用机器学习算法进行量化分析
**需要整理好的部分内容请到我的另一个仓库中!!![https://github.com/moyuweiqing/A-stock-prediction-algorithm-based-on-machine-learning]**
**项目很乱!!!**
**项目很乱!!!**
**项目很乱!!!**
不多说废话,直接说明项目,关键字:**量化投资、机器学习、股票交易**。该项目包括多个部分
1. 数据收集
2. 基本面分析
3. 技术面分析
4. 消息面分析
5. 回测系统
**1. 数据收集**
【文件夹:get_data】
该部分用来获取原始的数据,主要用于基本面和技术面分析,数据来源是通过python的tushare库,tushare是一个成熟的开源的金融信息数据接口[tushare](http://tushare.org),里面提供了多个不同的函数来获取各种不同的表格数据,存储于.csv文件中。
【文件夹:news】
cctv.py是一个爬虫,爬取CCTV新闻联播的新闻内容,并筛选关键词。TextSpider.py也是一个爬虫,爬取CCTV财经新闻内容。这两部分主要用于消息面分析中。
**2. 基本面分析**
【文件夹:基本面传统算法】
a-f.py是基本面分析中使用ROE算法进行分析的各个步骤,data.csv是这个过程中的临时数据,以及存在的各个年度的财务报表。
在基本面分析中使用了传统的ROE因子选股策略,机器学习算法为朴素贝叶斯算法。选用2016年-2019年沪深300成分股的前三季度的财务报表进行分析,通过不同的策略进行选股,并分析投资组合收益率。
在这里的传统ROE算法为:
1. 2016-2018三年的ROE值均大于10%
2. 2019年前三季度的ROE均上升,没有下跌
3. 满足以上条件的ROE值前十的股票
回测时期为:2019年10月28号-2019年11月8号
**3. 技术面分析**
【文件夹:个股预测】
在这里面,有多种个股预测的算法,其中里面的multi-thread文件夹是用来进行单日拟合的,进行区分以实现多线程运行。
【文件夹:技术面传统算法】
在这个文件夹中,主要有各种传统的算法,主要为移动平均算法、相对强弱因子,顺带需要分析的数据。
【文件夹:技术面机器学习算法】
技术面分析中使用到的是机器学习算法为:
1.Auto-ARIMA算法
2.LSTM算法
3.Prophet算法
4.SVM算法
其中,SVM算法是用于定性分析,在测试中SVM的成功率非常高。其他的各种算法用于定量分析,在定量分析中,又分为单次回归和单日回归,其中各种算法的优势比较为:
| 机器学习算法 | 单次拟合效果 | 单日拟合效果 | 算法效率 |
| ------------- | ------------- | ------------- | ------------- |
| Auto-ARIMA | 较差 | 很好 | 非常慢 |
| Prophet | 较差 | 较好 | 较慢 |
| LSTM | 较好 | 较好 | 快 |
**4. 消息面分析**
广泛来说,消息面分析的数据是海量的,根本分析不完。在这里是选用了CCTV新闻联播节目中的近几个月的消息,使用jieba分词库和snownlp情感分析库进行分析,提取关键词,获得需要关注的模块信息。
【文件夹:news】
在这里面的各种data.txt文件是各种新闻信息,snownlp.py文件用来进行情感分析,cctv.txt是进行关键词提取之后的新闻标题。
*然而,经历了2020年年初的新冠肺炎疫情我们可以认定,市场的总体走势其实是由宏观经济情况和其他非经济因素所影响的,这里面涉及到消息面分析,而对于个股分析中,才涉及到基本面和技术面分析*
**5. 回测系统**
【文件夹:sz50】
回测系统是自己搭建的,用于进行回测,但是比较简单,没有涉及到交易费用,只是实现了股票的买入卖出和收益率的计算,对于各种因素指标的实现需要之后再进行实现,以及数据可视化部分,并没有类似于聚宽平台<https://www.joinquant.com/>这样的一个比较完整的回测平台。
在这里主要是对技术面算法的数据进行回测,使用的数据集市上证50指数的成分股,可以获得回测的收益率。
【文件夹:prediction】
这个文件夹里面包含的是进行回测的数据,多种机器学习的算法进行测试。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
基于机器学习的股票投资算法,使用到了Auto-ARIMA、LSTM、SVM、Prophet、朴素贝叶斯、移动平均算法等多个算法,从信息收集、算法分析、回测等多个方面进行分析,从消息面、基本面、技术面三种分析方法进行分析。 基于机器学习的股票投资算法是一种利用机器学习技术来辅助股票投资决策的算法。这些算法通常通过分析历史市场数据、公司财务数据、行业趋势等多种因素,来预测股票价格的未来走势或评估投资组合的风险和收益。 以下是一些基于机器学习的股票投资算法的关键组成部分和工作原理: 数据收集与预处理: 收集历史股票价格、交易量、财务数据、行业数据等。 对数据进行清洗、整理、转换,以符合机器学习模型的输入要求。 可能需要进行特征工程,以提取对股票价格有影响的特征。 机器学习模型选择与训练: 选择合适的机器学习模型,如支持向量机(SVM)、神经网络(如深度学习)、随机森林、梯度提升机等。 使用历史数据训练模型,使模型能够学习到股票价格与各种因素之间的关系。 模型评估与优化: 使用测试集或验证集评估模型的性能,如准确率、召回率、F1分数等。 根据评估结果调整模型参数或尝试不同的模型结构,以优化
资源推荐
资源详情
资源评论
收起资源包目录
基于机器学习的股票投资算法,使用到了Auto-ARIMA、LSTM、SVM、Prophet、朴素贝叶斯、移动平均算法等多个算法 (299个子文件)
2019_3_c.csv 282KB
2018_3_c.csv 281KB
2019_2_c.csv 280KB
2018_2_c.csv 277KB
2019_1_c.csv 274KB
2018_1_c.csv 272KB
2017_2_c.csv 270KB
2017_3_c.csv 269KB
2019_3.csv 268KB
2018_3.csv 267KB
2019_2.csv 266KB
2018_2.csv 263KB
2017_1_c.csv 262KB
2019_1.csv 260KB
2018_1.csv 258KB
2017_2.csv 257KB
2017_3.csv 255KB
2017_1.csv 249KB
2016_3.csv 246KB
2016_2.csv 244KB
2016_1.csv 231KB
test.csv 133KB
test.csv 133KB
test.csv 72KB
pf.csv 63KB
data2.csv 59KB
process.csv 56KB
test8.csv 49KB
test8.csv 49KB
test5.csv 48KB
test5.csv 48KB
test4.csv 48KB
test4.csv 48KB
test3.csv 47KB
test3.csv 47KB
test7.csv 47KB
test7.csv 47KB
test9.csv 47KB
test9.csv 47KB
test6.csv 47KB
test6.csv 47KB
test2.csv 46KB
test2.csv 46KB
data.csv 42KB
total.csv 38KB
test.csv 29KB
row_data.csv 26KB
row_data2.csv 26KB
predict.csv 25KB
test.csv 18KB
test.csv 18KB
data3.csv 13KB
train.csv 8KB
valid.csv 8KB
train.csv 7KB
train.csv 7KB
test.csv 7KB
f.csv 6KB
t2_predict.csv 6KB
t3_predict.csv 6KB
t3_predict.csv 6KB
t2_predict.csv 6KB
valid.csv 6KB
t1_predict.csv 6KB
t1_predict.csv 6KB
t5_predict.csv 6KB
t5_predict.csv 6KB
t4_predict.csv 6KB
t4_predict.csv 6KB
valid.csv 4KB
asset.csv 3KB
lastday.csv 3KB
lastday.csv 3KB
yield_list.csv 3KB
f.csv 2KB
prophet.csv 2KB
process1.csv 2KB
t2_lastday.csv 2KB
t3_lastday.csv 2KB
t1_lastday.csv 2KB
t4_lastday.csv 2KB
t5_lastday.csv 2KB
asset.csv 2KB
yield_list.csv 2KB
README.md 4KB
LSTM-集合5.png 48KB
沪深300成分股预测.py 17KB
沪深300成分股预测.py 17KB
回测2.py 17KB
回测.py 17KB
回测.py 17KB
a.py 6KB
data_process_byprophet.py 6KB
data_process1.py 6KB
lstm.py 5KB
n1.py 5KB
n1.py 5KB
n8.py 4KB
n4.py 4KB
n5.py 4KB
共 299 条
- 1
- 2
- 3
资源评论
生瓜蛋子
- 粉丝: 3824
- 资源: 5216
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功