一、实验名称:使用朴素贝叶斯进行社会媒体挖掘
1、实验目的:
使用朴素贝叶斯进行社会媒体挖掘
2、实验内容:
学习朴素贝叶斯算法原理,并使用朴素贝叶斯进行社会媒体挖掘
3、实验环境(设备、软件、实验数据):
设备:笔记本电脑
软件:Python idle
实验数据:python_classes.data、python_tweets.data
4、实验步骤:
1. 安装相关 Python 库 Json、nltk、Numpy、Sklearn、twitter;
2. 从社交网站下载数据;
import twitter
consumer_key = "<Your Consumer Key Here>"
consumer_secret = "<Your Consumer Secret Here>"
access_token = "<Your Access Token Here>"
access_token_secret = "<Your Access Token Secret Here>"
authorization = twitter.OAuth(access_token, access_token_secret,
consumer_key, consumer_secret)
import os
output_filename = os.path.join(os.path.expanduser("~"),"Data", "twitter", "python_tweets.json")
import json
t = twitter.Twitter(auth=authorization)
3. 获取到 Twitter 消息,使用 json 库的 dump 函数将其转换为字符串形式后,写入到
输出文件中;
with open(output_filename, 'a') as output_file:
search_results = t.search.tweets(q="python", count=100)['statuses']
for tweet in search_results:
if 'text' in tweet:
output_file.write(json.dumps(tweet))
output_file.write("")
4. 加载库,提取消息;
import os
import json
评论0
最新资源