没有合适的资源?快使用搜索试试~
我知道了~
文库首页
大数据
算法与数据结构
adults、advertisement数据集 最佳特征选择 转换器
adults、advertisement数据集 最佳特征选择 转换器
共317个文件
py:249个
pyd:24个
exe:11个
数据挖掘
需积分: 12
11 下载量
55 浏览量
2018-01-12
11:07:28
上传
评论
收藏
8.47MB
ZIP
举报
温馨提示
立即下载
包括adults和advertisement两个数据集,代码为pycharm工程文件,python3.6。注释详细。参考资料为python数据挖掘入门与实践第五章。
资源详情
资源评论
收起资源包目录
adults、advertisement数据集 最佳特征选择 转换器
(317个子文件)
activate
2KB
activate.bat
641B
deactivate.bat
368B
sysconfig.cfg
3KB
pyvenv.cfg
117B
ad.data
9.8MB
adult.data
3.79MB
python36.dll
3.44MB
tk86t.dll
1.88MB
tcl86t.dll
1.59MB
sqlite3.dll
1.1MB
vcruntime140.dll
86KB
python3.dll
57KB
setuptools-28.8.0-py3.6.egg
454KB
python.exe
98KB
pythonw.exe
97KB
t64.exe
96KB
w64.exe
92KB
t32.exe
87KB
w32.exe
84KB
pip.exe
73KB
pip3.exe
73KB
easy_install.exe
73KB
easy_install-3.6.exe
73KB
pip3.6.exe
73KB
adult_pro ch05.iml
644B
ad.names
35KB
adult.names
5KB
not-zip-safe
1B
cacert.pem
337KB
PKG-INFO
3KB
Activate.ps1
1KB
easy-install.pth
54B
setuptools.pth
31B
pyparsing.py
219KB
html5parser.py
114KB
__init__.py
101KB
tarfile.py
90KB
constants.py
81KB
big5freq.py
81KB
ipaddress.py
78KB
_tokenizer.py
75KB
util.py
52KB
locators.py
50KB
database.py
49KB
jisfreq.py
46KB
req_install.py
45KB
euckrfreq.py
45KB
compat.py
40KB
index.py
39KB
wheel.py
38KB
metadata.py
38KB
distro.py
37KB
gb2312freq.py
35KB
euctwfreq.py
34KB
req_set.py
34KB
connectionpool.py
33KB
_inputstream.py
32KB
download.py
31KB
wheel.py
31KB
models.py
30KB
six.py
29KB
six.py
29KB
specifiers.py
27KB
__init__.py
27KB
sysconfig.py
26KB
shutil.py
25KB
sessions.py
25KB
sanitizer.py
25KB
utils.py
24KB
version.py
23KB
dictconfig.py
23KB
appdirs.py
22KB
index.py
21KB
adapters.py
19KB
mbcssm.py
19KB
jpcntx.py
19KB
response.py
18KB
cookies.py
18KB
langcyrillicmodel.py
17KB
install.py
17KB
_ihatexml.py
16KB
cmdoptions.py
16KB
scripts.py
15KB
manifest.py
14KB
serializer.py
14KB
etree_lxml.py
14KB
base.py
14KB
hebrewprober.py
13KB
poolmanager.py
13KB
controller.py
13KB
langbulgarianmodel.py
12KB
etree.py
12KB
langgreekmodel.py
12KB
langhungarianmodel.py
12KB
__init__.py
12KB
req_file.py
12KB
basecommand.py
12KB
pyopenssl.py
12KB
ssl_.py
11KB
共 317 条
1
2
3
4
评论
收藏
内容反馈
立即下载
评论0
去评论
最新资源
正点原子HAL库 STM32F4 外部中断(学习自用附源码)
delphi rzcombobox DropDownList 灰色背景改为白色
sap sd.docsap sd.doc
torch-1.10.2-cp38-cp38-win-amd64.whl
菜单栏实现增加数据,修改数据,查询数据,删除数据
全国省市区三级联动json文件,带code
C8_全局&局部&static.zip
Unity和安卓交互插件Unity调Android Native Goodies PRO
基于PHP的校园二手信息网站的设计与开发(源代码).tar
labview.doc
Linh-小哀
粉丝: 15
资源:
5
私信
上传资源 快速赚钱
前往需求广场,查看用户热搜
相关推荐
adult 数据集
一个比较经典的数据集,用在数据分析,机器学习中用来分析算法的一个很好的例子
5星 · 资源好评率100%
特征选择数据集
特征选择数据集,用于文献[1]Joint Embedding Learning and Sparse Regression: A Framework for Unsupervised Feature Selection
adult数据集分析
adult数据集数据挖掘,基于python语言的决策树算法,源码+数据
Autism-Detection-in-Adults:这是与成人个体自闭症谱系障碍(ASD)筛查有关的二进制分类问题。 给定一个人的某些属性,我的模型可以预测该人是否有可能使用不同的监督学习技术和多层感知器来获得ASD
数据集名称:成人自闭症谱系筛查数据 摘要:自闭症谱系障碍(ASD)是一种与显着的医疗费用有关的神经发育疾病,早期诊断可以显着减少这些疾病。 不幸的是,等待ASD诊断的时间很长,而且程序的成本效益也不高。 自闭症的经济影响和全世界ASD病例数量的增加表明,迫切需要开发易于实施和有效的筛查方法。 因此,迫切需要进行时间高效且可访问的ASD筛查,以帮助卫生专业人员并告知个人是否应进行正式的临床诊断。 全
Advertising数据集下载
Advertising.csv 是机器学习中线性回归算法中 双特征的典型数据集 , 希望喜欢。
4星 · 用户满意度95%
美国人口普查数据及数据说明
这是Coursera的Intro to Data Analysis for Python课程使用的美国人口普查数据,里面包含了一个数据文件和一个PDF文件,PDF文件解释了每个变量的意义。
adult数据挖掘.zip
adult数据集数据挖掘,基于python语言的决策树算法,包括数据处理与归类整理
数据挖掘常用算法代码实现
数据挖掘常用算法代码实现
5星 · 资源好评率100%
Predict-financial-recession:该项目的主要目标是根据金融公司报告中前 500 个词干的频率来预测金融衰退。 应用各种学习模型后,我们可以看到,词袋预测金融衰退的准确率在90%以上。 因此,两者之间确实存在相关性。 此外,我们比较了不同的学习模型(带有决策树、SVM 和 KNN 的集成方法)和各种参数,通过对训练数据集的交叉验证,找到具有相对较高的平均准确率和低准确率方差的最佳模型。 此外,我们还尝试了几种预处理方法(tf-idf、特征选择和基于质心的聚类)来提高学习模型的准确性。
该项目的主要目标是根据金融公司报告中前 500 个词干的频率来预测金融衰退。 应用各种学习模型后,我们可以看到,词袋预测金融衰退的准确率在90%以上。 因此,两者之间确实存在相关性。 此外,我们比较了不同的学习模型(带有决策树、SVM 和 KNN 的集成方法)和各种参数,通过对训练数据集的交叉验证,找到具有相对较高的平均准确率和低准确率方差的最佳模型。 此外,我们还尝试了几种预处理方法(tf-id
e15-4yp-Revealing-miRNA-Biomarkers-for-Alzheimer-s-Disease-using-NGS:该项目的主要目的是使用下一代测序数据找到一套用于阿尔茨海默氏病的miRNA生物标志物。 使用从NCBI数据库获得的数据集,访问号为GSE46579。 为了实现寻找最佳差异表达miRNA集合的目标,我们遵循了分步操作的过程,包括五个主要步骤,即数据收集,预处理,统计分析,特征选择和分类。 在数据收集阶段,选择了初始数据集。 我们使用Galaxy平台进行预处理。 统计分析包
请参考以下网址中的说明:
Mortality-Prediction-in-ICU-using-ANN-89-percent:用于挑战的数据包括来自12,000个ICU停留的记录。 ICU停留时间少于48小时被排除在外。入院后的前48小时内至少记录了42个变量。 患者的42个变量的一些示例是胆固醇,肌钙蛋白I,pH,胆红素等。特征选择一直非常关注。 在尝试了多种明智的组合后,并不是所有的42个变量都经过训练,而是一组最佳的选择特征,以获得最大的模型性能并避免过拟合。 使用了精度和召回率等指标以及准确性,并简要解释了为什么精度比召回率
使用人工神经网络的ICU死亡率预测为89% 用于挑战的数据包括来自12,000个ICU停留的记录。 ICU停留时间少于48小时被排除在外。入院后的前48小时内至少记录了42个变量。 患者的42个变量的一些示例是胆固醇,肌钙蛋白I,pH,胆红素等。特征选择一直非常关注。 在尝试了多种明智的组合后,并不是所有的42个变量都经过训练,而是一组最佳的选择特征,以获得最大的模型性能并避免过拟合。 使用了精
使用决策树和朴素贝叶斯算法对Adult数据集分类的源码
使用决策树和朴素贝叶斯算法对Adult数据集分类的源码,可以直接下载使用,替换输入数据即可,方便快捷
5星 · 资源好评率100%
Diabetes prevalence and glycemic control - Adults-数据集
这是由疾病控制与预防中心托管的数据集。关于成人的糖尿病患病率和血糖控制的数据集。 SELECT~1.CSV socrata_metadata.json Diabetes prevalence and glycemic control - Adults_datasets.txt
adult.data
uci的成人数据库,根据人口普查数据预测收入是否超过5万美元/年,也称为“普查收入”数据集。包含48842条记录,14个属性,有工作环境、教育、婚姻状况、职业、关系、种族和性别等分类变量和资本收益、资本支出两个...
预测年收入是否大于50K美元--adults.txt
读取adult.txt文件,最后一列是年收入,并使用KNN算法训练模型,然后使用模型预测一个人的年收入是否大于50 获取年龄、教育程度、职位、每周工作时间作为机器学习数据 获取薪水作为对应结果
数据分析入门所使用的美国人口普查数据及数据说明
这是Coursera的Intro to Data Analysis for Python课程使用的美国人口普查数据,里面包含CSV数据文件和一个PDF说明文件,解释了每个变量的意义。
5星 · 资源好评率100%
美国人口收入二分类.zip
美国1994年人口普查数据,居民年收入是否超过50K的分类问题。我用KNN算法实现了一下二分类。代码注释详细,附有实习指导书说明、数据。修改路径即可运行。
Autism Screening on Adults 成人自闭症筛查-数据集
通过预测自闭症的可能性来改善自闭症筛查。让机器学习模型能够预测患自闭症的可能性,从而让医疗专业人员能够优先考虑他们的资源。 autism_screening.csv
MAT格式高维特征选择数据集
MAT格式高维特征选择数据集(用于matlab),特征选择过程和数据集类型可参考https://www.omegaxyz.com/2019/06/26/divide-dataset/?hilite='数据集'
21ic下载_经典的LDA特征选择算法,用matlab实现,包括数据集.rar
21ic下载_经典的LDA特征选择算法,用matlab实现,包括数据集
贝叶斯和KNN算法比较——基于Adult数据集.rar_KNN贝叶斯_adult_knn 贝叶斯_贝叶斯
朴素贝叶斯算法和KNN算法比较,其中用到的数据集为adults
5星 · 资源好评率100%
酒店预订数据集 CSV 11W+记录
此数据集包含城市酒店和度假酒店的 119390 个观测值。每个观察结果代表 2015 年 7 月 1 日至 2017 年 8 月 31 日期间的酒店预订,包括有效到达的预订和取消的预订。 包含字段: hotel 酒店类型 - 度假酒店或城市酒店...
5星 · 资源好评率100%
吸入疗法与吸入装置Adults O.pdf
吸入疗法与吸入装置Adults O.pdf
Self-efficacy in caregivers of adults diagnosed with cancer: An
Self-efficacy in caregivers of adults diagnosed with cancer: An
数据挖掘入门资料,可以参考一下
数据挖掘参考文档,数据挖掘入门资料,可以参考一下
decisiontree决策树在adult数据集上的实现
决策树代码实现,参考机器学习实战,数据集采用的是adult数据集,增加了数据清洗,该决策树是随机实现的,增加了过拟合的剪枝。
5星 · 资源好评率100%
基于自编写的随机森林算法的adult数据集分类
压缩包主要采用随机森林算法处理adult数据集的分类问题,主要包含四部分,第一部分是由python编写的adult数据集预处理过程,第二部分是自己编写的随机森林算法处理adult数据集,第三部分是调用python中sklearn模块处理adult分类问题,第四部分是基于matlab调用5种机器学习分类算法分别处理adult分类问题比较哪种算法能够取得更好的分类效果。
5星 · 资源好评率100%
基于决策树和朴素贝叶斯算法对Adult数据集分类源码
个人课设时实现的基于决策树和朴素贝叶斯算法对Adult数据集进行分类的源码!
5星 · 资源好评率100%
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0
最新资源