# Stock-prediction-algorithm-based-on-machine-learning
## 使用机器学习算法进行量化分析
**需要整理好的部分内容请到我的另一个仓库中!!![https://github.com/moyuweiqing/A-stock-prediction-algorithm-based-on-machine-learning]**
**项目很乱!!!**
**项目很乱!!!**
**项目很乱!!!**
不多说废话,直接说明项目,关键字:**量化投资、机器学习、股票交易**。该项目包括多个部分
1. 数据收集
2. 基本面分析
3. 技术面分析
4. 消息面分析
5. 回测系统
**1. 数据收集**
【文件夹:get_data】
该部分用来获取原始的数据,主要用于基本面和技术面分析,数据来源是通过python的tushare库,tushare是一个成熟的开源的金融信息数据接口[tushare](http://tushare.org),里面提供了多个不同的函数来获取各种不同的表格数据,存储于.csv文件中。
【文件夹:news】
cctv.py是一个爬虫,爬取CCTV新闻联播的新闻内容,并筛选关键词。TextSpider.py也是一个爬虫,爬取CCTV财经新闻内容。这两部分主要用于消息面分析中。
**2. 基本面分析**
【文件夹:基本面传统算法】
a-f.py是基本面分析中使用ROE算法进行分析的各个步骤,data.csv是这个过程中的临时数据,以及存在的各个年度的财务报表。
在基本面分析中使用了传统的ROE因子选股策略,机器学习算法为朴素贝叶斯算法。选用2016年-2019年沪深300成分股的前三季度的财务报表进行分析,通过不同的策略进行选股,并分析投资组合收益率。
在这里的传统ROE算法为:
1. 2016-2018三年的ROE值均大于10%
2. 2019年前三季度的ROE均上升,没有下跌
3. 满足以上条件的ROE值前十的股票
回测时期为:2019年10月28号-2019年11月8号
**3. 技术面分析**
【文件夹:个股预测】
在这里面,有多种个股预测的算法,其中里面的multi-thread文件夹是用来进行单日拟合的,进行区分以实现多线程运行。
【文件夹:技术面传统算法】
在这个文件夹中,主要有各种传统的算法,主要为移动平均算法、相对强弱因子,顺带需要分析的数据。
【文件夹:技术面机器学习算法】
技术面分析中使用到的是机器学习算法为:
1.Auto-ARIMA算法
2.LSTM算法
3.Prophet算法
4.SVM算法
其中,SVM算法是用于定性分析,在测试中SVM的成功率非常高。其他的各种算法用于定量分析,在定量分析中,又分为单次回归和单日回归,其中各种算法的优势比较为:
| 机器学习算法 | 单次拟合效果 | 单日拟合效果 | 算法效率 |
| ------------- | ------------- | ------------- | ------------- |
| Auto-ARIMA | 较差 | 很好 | 非常慢 |
| Prophet | 较差 | 较好 | 较慢 |
| LSTM | 较好 | 较好 | 快 |
**4. 消息面分析**
广泛来说,消息面分析的数据是海量的,根本分析不完。在这里是选用了CCTV新闻联播节目中的近几个月的消息,使用jieba分词库和snownlp情感分析库进行分析,提取关键词,获得需要关注的模块信息。
【文件夹:news】
在这里面的各种data.txt文件是各种新闻信息,snownlp.py文件用来进行情感分析,cctv.txt是进行关键词提取之后的新闻标题。
*然而,经历了2020年年初的新冠肺炎疫情我们可以认定,市场的总体走势其实是由宏观经济情况和其他非经济因素所影响的,这里面涉及到消息面分析,而对于个股分析中,才涉及到基本面和技术面分析*
**5. 回测系统**
【文件夹:sz50】
回测系统是自己搭建的,用于进行回测,但是比较简单,没有涉及到交易费用,只是实现了股票的买入卖出和收益率的计算,对于各种因素指标的实现需要之后再进行实现,以及数据可视化部分,并没有类似于聚宽平台<https://www.joinquant.com/>这样的一个比较完整的回测平台。
在这里主要是对技术面算法的数据进行回测,使用的数据集市上证50指数的成分股,可以获得回测的收益率。
【文件夹:prediction】
这个文件夹里面包含的是进行回测的数据,多种机器学习的算法进行测试。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源内项目代码都是经过测试运行成功,功能正常的情况下才上传的,请放心下载使用。 2、适用人群:主要针对计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、数学、电子信息等)的同学或企业员工下载使用,具有较高的学习借鉴价值。 3、不仅适合小白学习实战练习,也可作为大作业、课程设计、毕设项目、初期项目立项演示等,欢迎下载,互相学习,共同进步! 基于机器学习的股票投资算法源码+项目说明(使用Auto-ARIMA、LSTM、SVM、Prophet、朴素贝叶斯、移动平均算法等).zip
资源推荐
资源详情
资源评论
收起资源包目录
基于机器学习的股票投资算法完整源码+说明(使用Auto-ARIMA、LSTM、移动平均算法等).zip (299个子文件)
2019_3_c.csv 282KB
2018_3_c.csv 281KB
2019_2_c.csv 280KB
2018_2_c.csv 277KB
2019_1_c.csv 274KB
2018_1_c.csv 272KB
2017_2_c.csv 270KB
2017_3_c.csv 269KB
2019_3.csv 268KB
2018_3.csv 267KB
2019_2.csv 266KB
2018_2.csv 263KB
2017_1_c.csv 262KB
2019_1.csv 260KB
2018_1.csv 258KB
2017_2.csv 257KB
2017_3.csv 255KB
2017_1.csv 249KB
2016_3.csv 246KB
2016_2.csv 244KB
2016_1.csv 231KB
test.csv 133KB
test.csv 133KB
test.csv 72KB
pf.csv 63KB
data2.csv 59KB
process.csv 56KB
test8.csv 49KB
test8.csv 49KB
test5.csv 48KB
test5.csv 48KB
test4.csv 48KB
test4.csv 48KB
test3.csv 47KB
test3.csv 47KB
test7.csv 47KB
test7.csv 47KB
test9.csv 47KB
test9.csv 47KB
test6.csv 47KB
test6.csv 47KB
test2.csv 46KB
test2.csv 46KB
data.csv 42KB
total.csv 38KB
test.csv 29KB
row_data.csv 26KB
row_data2.csv 26KB
predict.csv 25KB
test.csv 18KB
test.csv 18KB
data3.csv 13KB
train.csv 8KB
valid.csv 8KB
train.csv 7KB
test.csv 7KB
train.csv 7KB
f.csv 6KB
t2_predict.csv 6KB
t3_predict.csv 6KB
t3_predict.csv 6KB
t2_predict.csv 6KB
valid.csv 6KB
t1_predict.csv 6KB
t1_predict.csv 6KB
t5_predict.csv 6KB
t5_predict.csv 6KB
t4_predict.csv 6KB
t4_predict.csv 6KB
valid.csv 4KB
asset.csv 3KB
lastday.csv 3KB
lastday.csv 3KB
yield_list.csv 3KB
f.csv 2KB
prophet.csv 2KB
process1.csv 2KB
t2_lastday.csv 2KB
t3_lastday.csv 2KB
t1_lastday.csv 2KB
t4_lastday.csv 2KB
t5_lastday.csv 2KB
asset.csv 2KB
yield_list.csv 2KB
README.md 4KB
LSTM-集合5.png 48KB
沪深300成分股预测.py 17KB
沪深300成分股预测.py 17KB
回测2.py 17KB
回测.py 17KB
回测.py 17KB
a.py 6KB
data_process_byprophet.py 6KB
data_process1.py 6KB
lstm.py 5KB
n1.py 5KB
n1.py 5KB
n8.py 4KB
n4.py 4KB
n5.py 4KB
共 299 条
- 1
- 2
- 3
资源评论
龙年行大运
- 粉丝: 1001
- 资源: 3854
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功