Python、Json和Seaborn可视化展示电影实体（源码）_读取json标签数量并可视化资源-CSDN文库

共16个文件

py：8个

csv：8个

Python

Seaborn

Json

可视化

源码

5星 · 超过95%的资源需积分: 50 57 浏览量 2019-02-13 14:03:11 上传评论 2 收藏 25KB RAR 举报

资源推荐

资源详情

资源评论

收起资源包目录

ShowPic_KG.rar （16个子文件）

ShowPic_KG

show_height_mass.py 2KB

film_planets.csv 10KB

stat_basic.csv 1KB

film_species.csv 20KB

stat_character.csv 5KB

film_starships.csv 21KB

show_scatter.py 831B

get_jsonfils.py 756B

show_height_mass2.py 896B

get_jsondetails.py 732B

show_hist.py 582B

get_details.py 2KB

film_characters.csv 41KB

film_vehicles.csv 18KB

get_films.py 805B

films.csv 19KB

# coding: utf-8 import urllib.request as urllib2 import json #设置headers headers = {} headers["User-Agent"] = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36" #读取文件-读取json信息并将json格式数据转换为字典 f = open('films.csv', 'r', encoding='utf-8') films = [] for line in f.readlines(): #print(line) print(line.strip('\n')) line = json.loads(line.strip('\n')) films.append(line) f.close() #遍历每部电影films的实体并获取其他实体 #获取 characters人物, planets星球, starships飞船, vehicles装备, species种族 targets = ['characters', 'planets', 'starships', 'vehicles', 'species'] for target in targets: print(target) #循环获取五类数据并存储至文件 fw = open('film_' + target + '.csv', 'w') data = [] #获取7部电影信息的实体名称 for item in films: tmp = item[target] #实体对应的链接 print(tmp) for t in tmp: if t in data: #如果实体已经存在则跳过比如某部电影人物另一部也出现了 continue else: data.append(t) #循环请求直到成功防止网络延迟 while 1: try: print(t) request = urllib2.Request(url=t, headers=headers) response = urllib2.urlopen(request) result = response.read().decode('utf-8') except Exception as e: continue #请求失败循环继续 else: fw.write(result+"\n") break #请求成功跳出循环 finally: pass #查看七部电影含这种实体多少个 print(str(len(data)), target) fw.close() print("success")

评论收藏

内容反馈