# -*- coding: utf-8 -*-
"""
Created on Thu Mar 28 19:17:46 2019
@author: Dan
"""
import pymysql
import numpy as np
import sys
import json
import urllib.request
import urllib
import os
import time
#连接数据库
db = pymysql.connect(host='127.0.0.1',user='root',password='root',db='gp_db',port=3306)
#获取cursor
cursor = db.cursor()# 使用 execute() 方法执行 SQL,如果表存在则删除
sql = "select * from gp"
cursor.execute(sql)
print("SELECT OK")
#all_gp = cursor.fetchmany(1)
all_gp = cursor.fetchall() #从数据库中获取所有股票的基本信息数据
arr = np.array(all_gp) #转化为numpy数据格式
now = int(time.time())
#转换为其他日期格式,如:"%Y-%m-%d %H:%M:%S"
timeStruct = time.localtime(now)
strTime = time.strftime("%Y-%m-%d", timeStruct)
gp_count = 1 #股票当天所有数据的保存编号
def mkdir(path): #股票保存路径函数
folder = os.path.exists(path)
if not folder: #判断是否存在文件夹如果不存在则创建为文件夹
os.makedirs(path) #makedirs 创建文件时如果路径不存在会创建这个路径
print(path)
def getData(url): #函数——从接口中获取单只股票当天每分钟的数据
content = ""
try: #网络会偶发出现奔溃情况,为了保证不中断和保证数据齐全,休息5秒重新执行
response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')
except:
print("发生网络异常")
time.sleep(5)
return getData(url)
if content != "":
return content
else:
print("内容为空")
return getData(url)
def csv_create(path, msg): #函数——将单只股票的数据保存进指定文件夹
file = open(path,'w')
file.write(msg)
print("文件"+path+"创建成功")
file.close()
def tranformToCSV(content,filepath): #函数——将下载的数据转换为csv数据,以便读取
content = content.replace("(","").replace(")","")
json_str = json.loads(content)
a_str = json_str.get("data")
a_time = json_str.get("info").get("time")
a_date = str(a_time).split(" ")
mkdir(filepath)
array_str = np.array(a_str)
csv_str = "time,first,second,third,fourth\n" #time为当天时间点,first为该分钟股票价格
for item in array_str:
item = str(item)
items = item.split(",")
itemss = (str(items[0])).split(" ")
items0 = itemss[1]
csv_str += '"'+items0+'",'+items[1]+','+items[2]+','+items[3]+','+items[4]+'\n'
csv_create(filepath+"/"+a_date[0]+".csv",csv_str)
for item in arr:
url = "http://pdfm.eastmoney.com/EM_UBG_PDTI_Fast/api/js?rtntype=5&id="+item[3]+item[1]+"&type=r&iscr=false"
data = getData(url)
item2 = item[2].replace("*","")
tranformToCSV(data,"D://gp/"+str(gp_count)+"、"+item2+item[3]) #股票信息的保存路径是(D://pg/序号+股票名字+股票代号/日期.csv)
gp_count = gp_count+1;
# 使用 DebugLog
db.commit()
db.close()
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
项目介绍可查看作者MLDan写的文章:作为一个程序员,总喜欢在股市里面晃荡,无奈总是当成韭菜收割了。每一次都是卖涨买跌,处处碰壁。但是作为一个有一定阅历的程序员本能告诉自己,只要掌握了大量的股票数据,就可以在信息渠道落后的情况下,分析出机构大概率的在布局哪些股票,从而在机构拉涨停之前,提前进入分一杯羹。于是,开始编写了爬取股票数据并进行数据分析的程序。
资源推荐
资源详情
资源评论
收起资源包目录
python股票爬虫及分析项目.rar (4个子文件)
python股票爬虫及分析项目
get_gp_detail.py 3KB
gp.sql 129KB
plt_show.py 1016B
find_feature.py 2KB
共 4 条
- 1
资源评论
- 列强哈哈2020-07-10不行哦,运行不起来
- 棉花哥2020-08-19我倒是跑起来了 改改就能起
MLDan
- 粉丝: 142
- 资源: 2
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功