python解决动态的定义变量名,并给其赋值的方法(大数据处理)_names=locals()资源-CSDN文库

定义变量名

177 浏览量 2020-09-19 23:20:02 上传评论收藏 66KB PDF 举报

资源推荐

资源详情

资源评论

python 解决动态的定义变量名解决动态的定义变量名,并给其赋值的方法并给其赋值的方法(大数据处大数据处

理理)

今天小编就为大家分享一篇python 解决动态的定义变量名,并给其赋值的方法(大数据处理)，具有很好的参考价

值，希望对大家有所帮助。一起跟随小编过来看看吧

最近消费kafka数据到磁盘的时候遇到了这样的问题：

需求：需求：每天大概有1千万条数据，每条数据包含19个字段信息，需要将数据写到服务器磁盘，以第二个字段作为大类建立目

录，第7个字段作为小类配合时间戳作为文件名，临时文件后缀tmp，当每个文件的写入条数（可配置，比如100条）达到要求

条数时，将后缀tmp改为out。

问题：问题：大类共有30个，小类不计其数而且未知，比如大类为A,小类为a，时间戳为20180606095835234，则A目录下的文件名

为20180606095835234_a.tmp,这样一来需要在此文件写满100条时，更新时间戳生成第二个文件名，如果此时有1000个文件

都在写则需要有1000个时间戳，和1000个计数器记录每个文件当前的条数，如果分别定义1000个变量显然是不划算的，

尝试：中间过程想到了动态定义变量名，即尝试：中间过程想到了动态定义变量名，即

定义第七个字段：seven = data.split('|')[7]

定义文件名：filename = time_stamp + '_' + seven+'.tmp'，

定义文件计数器：seven + ‘_num' = 0

定义文件时间戳：seven + '_stamp' = time.time( )

想法其实是没问题的，但是这里用到了一个不常用的语法：用一个变量名和一个字符串拼接出来一个新的变量名，并继续赋值

（不知道我的表述是否清楚），试过了用local（）函数、global（）函数、exec（）函数都没有达到预期效果，也许是把问题

想的太复杂了

解决：最后使用三个字典将这个问题完美解决，解决：最后使用三个字典将这个问题完美解决，

定义一个字典用来存计数器，字典的每一个键对应一个文件名，值对应当前计数，并实时更新；

定义一个字典用来存时间戳，键对应一个文件名，值对应时间戳，达到100条就更新一次；

定义一个字典用来存大类，键对应代号，值对应分类；

局部功能代码如下：局部功能代码如下：

def kafka_to_disk():

print('启动前检测上次运行时是否存在意外中断的数据文件......')

print('搜索最近一次执行脚本产生的时间目录......')

# 待处理临时文件列表

tmp_list = []

try:

for category_dir in os.listdir(local_file_path):

if len(os.listdir(local_file_path+os.sep+category_dir)) > 0:

for file in os.listdir(local_file_path+os.sep+category_dir):

if suffix in file:

tmp_list.append(local_file_path+os.sep+category_dir+os.sep+file)

# print('上次运行程序产生的临时文件有---{}'.format(tmp_list))

except Exception as e:

pass

if len(tmp_list) == 0:

print('未扫描任何残留临时文件')

else:

print('开始修复残留临时文件......')

tmp_num = 0

for tmp in tmp_list:

os.rename(tmp, tmp.split('.')[0]+'.out')

tmp_num += 1

print('本次启动共修复残留临时文件★★★★★-----{}个-----★★★★★'.format(tmp_num))

category_poor = {

'1': 'news', '2': 'weibo', '3': 'weixin', '4': 'app', '5': 'newspaper', '6': 'luntan',

'7': 'blog', '8': 'video', '9': 'shangji', '10': 'shangjia', '11': 'gtzy', '12': 'zfztb',

'13': 'gyfp', '14': 'gjz', '15': 'zfxx', '16': 'ptztb', '17': 'company', '18': 'house',

'19': 'hospital', '20': 'bank', '21': 'zone', '22': 'express', '23': 'zpgw', '24': 'zscq',

'25': 'hotel', '26': 'cpws', '27': 'gxqy', '28': 'gpjj', '29': 'dtyy', '30': 'bdbk'}

time_stamp = utils.get_time_stamp() # 初始化毫秒级时间戳： 20180509103015125

consumer = KafkaConsumer(topic, group_id=group_id, auto_offset_reset=auto_offset_reset, bootstrap_servers=eval(bootstrap_servers))

print('连接kafka成功,数据筛选中......')

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

内容反馈

weixin_38530536

粉丝: 4
资源: 971

最新资源

资源上传下载、课程学习等过程中有任何疑问或建议，欢迎提出宝贵意见哦~我们会及时处理！点击此处反馈

feedback-tip