没有合适的资源?快使用搜索试试~ 我知道了~
对python .txt文件读取及数据处理方法总结
5星 · 超过95%的资源 123 下载量 135 浏览量
2020-09-20
14:18:36
上传
评论 4
收藏 75KB PDF 举报
温馨提示
试读
4页
下面小编就为大家分享一篇对python .txt文件读取及数据处理方法总结,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
资源推荐
资源详情
资源评论
对对python .txt文件读取及数据处理方法总结文件读取及数据处理方法总结
下面小编就为大家分享一篇对python .txt文件读取及数据处理方法总结,具有很好的参考价值,希望对大家有所
帮助。一起跟随小编过来看看吧
1、处理包含数据的文件、处理包含数据的文件
最近利用Python读取txt文件时遇到了一个小问题,就是在计算两个np.narray()类型的数组时,出现了以下错误:
TypeError: ufunc 'subtract' did not contain a loop with signature matching types dtype('<U3') dtype('<U3') dtype('<U3')
作为一个Python新手,遇到这个问题后花费了挺多时间,在网上找了许多大神们写的例子,最后终于解决了。
总结如下:总结如下:
(1)出现此问题的原因是:目的是想计算两个数组间的差值,但数组中的元素不是数据类型(float或int等),而是str类型
的。
(2)解决方法:在为空数组添加数据过程中,将每个数据强制转化为float型。
如将“character.append(dataSet[i][:-1])”修改为“ character.append([float(tk) for tk in dataSet[i][:-1]])”
现将利用现将利用Python读取读取txt文件的过程总结如下:文件的过程总结如下:
python版本为版本为python3.6
(1)函数定义,存放于Function.py文件中:
from numpy import *
import random
#读取数据函数,返回list类型的训练数据集和测试数据集
def loadData(fileName):
trainingData=[]
testData=[]
with open(fileName) as txtData:
lines=txtData.readlines()
for line in lines:
lineData=line.strip().split(',') #去除空白和逗号“,”
if random.random()<0.7: #数据集分割比例
trainingData.append(lineData) #训练数据集
else:
testData.append(lineData) #测试数据集
return trainingData,testData
#输入数据为list类型,分割数据集,分割为特征和标签两部分,返回数据为np.narray类型
def splitData(dataSet):
character=[]
label=[]
for i in range(len(dataSet)):
character.append([float(tk) for tk in dataSet[i][:-1]])
label.append(dataSet[i][-1])
return array(character),array(label)
(2)实现两个数组间的减法,存放于main.py文件中:
#__author__=='qustl_000'
#-*- coding: utf-8 -*-
import numpy as np
import Function
fileName="1.txt"
trainingData,testData=Function.loadData(fileName)
trainingCharacter,trainingLabel=Function.splitData(trainingData)
testCharacter,testLabel=Function.splitData(testData)
diff1=np.tile(testCharacter[0],(len(trainingCharacter),1))-trainingCharacter
print('测试数据集的一条数据,扩充到与训练数据集同维:')
print(np.tile(testCharacter[0],(len(trainingCharacter),1)))
print('训练数据集:')
print(trainingCharacter)
print('作差后的结果:')
print(diff1)
(3)运行结果:
测试数据集的一条数据,扩充到与训练数据集同维:
[[ 1.5 60. ]
[ 1.5 60. ]
[ 1.5 60. ]
资源评论
- shkpwbdkak2023-07-25这篇文章没有过多的废话,直接切入主题,给人一种学习的紧迫感。
- 地图帝2023-07-25读完这篇文章后,对于如何在Python中读取并处理.txt文件有了更清晰的认识,非常感谢作者的分享。
- 内酷少女2023-07-25作者对于不同的txt文件格式的处理方法进行了详细的讲解,让人受益匪浅。
- 史努比狗狗2023-07-25文章中的示例代码非常易懂,对于初学者来说是一个很好的入门教程。
- 茶啊冲的小男孩2023-07-25这篇文件对于新手来说真的非常实用,简单明了地介绍了Python中处理.txt文件的方法。
weixin_38703980
- 粉丝: 6
- 资源: 878
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功