黄金舆情数据分析
项目流程
(1)舆情数据获取
爬取尽量多的新闻、点评以及行情播报等内容。
(2)舆情数据分类
以按照数据来源、数据内容分类。
(3)情绪分类
对每一条舆情进行舆情分类,可分为乐观、悲观、中性三类,可使用人工字典分类法或者机器学习自动分类法。
(4)构建变量
两种变量构建思路: a. 对舆情分类进行加工,构建情绪指标。 b. 对每一条新闻进行加工,构建词频变量。
(5)数据训练及结果分析
使用机器学习等方法对训练集进行训练,并进行结果分析。
(6)因子测试
使用情绪指标进行因子测试
(7)策略构建
根据训练结果构建黄金交易策略。