基于上市公司年报的数据分析
目录
基于上市公司年报的数据分析 ...............................................................3
摘 要: ....................................................3
数据清洗 ....................................................4
数据背景 ..................................................................................................4
数据清洗 ..................................................................................................4
数据可视化分析 ..............................................5
相关性分析 ..............................................................................................5
整体热力图分析 .......................................................................................6
成交量分析 ..............................................................................................8
K 线图分析 ............................................................................................11
分析总结 ...................................................11
附录: .....................................................12
基于上市公司年报的数据分析
摘 要:
上市公司的经营业绩与其股票价格、 市场价值息息相关, 因此反映上市公司经营
业绩的定期公开披露的中期会计报告、 年度会计报告就成为社会各界密切关注的重要信息
之一。 对所有上市公司的财务报告进行统计整理和分析, 把握上市公司整体的经营状况、
经营业绩的水平和变化趋势, 无论是对投资选择, 还是政府的决策与监督, 都是不可或
缺的。本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析, 这对于
投资者、投资咨询人员或是理论界研究者, 都具有实际的指导意义。 通过本案例的学习讨
论, 有助于大家掌握统计描述和相关回归分析的方法, 同时积累应用这些方法的实际经
验和教训。本案例所依托的客体是 1999 年上市公司年报中的有关财务指标。 1999 年末,
沪、 深两市共有上市公司 949 家。 这些上市公司分布在 13 个行业部门。 根据中国证监
会的《上市公司分类指引》中规定的分类方法, 其中制造业共有 578 家, 占 60. 91%。
总股本 1938 亿元, 占 62. 73%, 制造业是上市公司最集中的行业。 截止 2000 年 4 月
30 日, 已公布年报的有 560 家。 所以本案例研究总体范围确定为如期公布年报的制造业
560 家上市公司。
1. 上市公司年报财务数据统计分析的目的
通过对制造业 1999 年报有关数据进行系统的统计整理、 描述和回归分析, 揭示 1999
年制造业上市公司主要财务指标的总体分布、 分行业的经营业绩水平和重要特征, 从中
掌握认识总体分布特征和数量变化的技巧和方法, 提高用统计思想和方法解决实际问题的
能力。
2. 上市公司年报财务数据统计分析的任务
对纷繁的数据进行不同的分类、 分组、 汇总、 综合、 分析、 归纳、 推断, 显示上市
公司财务报告中的主要财务指标的分布形态和主要特性, 寻找财务指标之间的相互关系和
表现规律。
3. 上市公司年报财务数据统计分析的对象
本案例所引用资料取自《上海证券报》, 包括了制造业 560 家上市公司。 共选有 8 个财
务指标:总资产、 净利润、 主营业务收入、 股东权益、 每股收益、 每股净资产和股东
权益比率。 其中。
关键词:经营业绩、股票价格、分析、决策
数据清洗
数据背景
主要是当下茅台企业的股票数据,代表当下实体制造业的走向和经济趋势,对其数据进行分
析。
数据的主要展示:
日期
股票代码
名称
收盘价
最高价
最低价
开盘价
前收盘
涨跌额
涨跌幅
换手率
成交量
成交金额
总市值
流通市值
数据清洗
使用主要的 skleran 和 pandas 进行数据清洗:
Skyran Scikit learn 主要用 Python 编写,numpy 广泛用于高性能线性代数和数组运
算。此外,一些核心算法是用 Python 编写的,以提高性能。支持向量机由围绕 LIBSVM 的
Python 包装器实现;逻辑回归和线性支持向量机的类似包装围绕 LIBLINEAR 展开。在这种
情况下,您可能无法使用 Python 扩展这些方法。
Scikit-learn 与许多其他 Python 库很好地集成,例如用于绘图的 matplotlib 和 plotly、
用于数组矢量化的 numpy、panda 数据帧、scipy 等。
Pandas 是 python 的数据分析包。它最初由 AQR 资本管理公司于 2008 年 4 月开发,
并于 2009 年底开源。目前,PyData 开发团队专注于 Python 数据包的开发,并继续开发和维
护它,这是 PyData 项目的一部分。Pandas 最初是作为金融数据分析工具开发的,因此它为
时间序列分析提供了良好的支持。Pandas 的名称来自面板数据和 python 数据分析。面板数
据是经济学中关于多维数据集的术语。面板的数据类型也在 Pandas 中提供。
数据清洗删除不需要的列
data.drop(['股票代码','名称','日期',],axis=1, inplace=True) #
对无用的空值进行删除,删除所在的行
data=data.dropna(axis=0, how='any')
数据显示:
数据可视化分析
相关性分析
数据相关性是指数据之间存在某种关系。大数据时代,数据相关分析因其具有可以快捷、高
效地发现事物间内在关联的优势而受到广泛关注,并有效地应用于推荐系统、商业分析、公
共管理、医疗诊断等领域。数据相关性可以时序分析、空间分析等方法进行分析。数据也面
对着高维数据、多变量数据、大规模数据、增长性数据及其可计算方面等挑战。
股票属性的相关性分析:收盘价和前收盘 分析图