数据挖掘_大数据_IT技术下载资源_会员免费-CSDN开发者文库

综合最新热门
根据电力调度系统的结构和安全需求，总结了入侵检测系统的工作原理、结构及存在的问题．比较了基于数据挖掘技术的入侵检测系统与其他入侵检测系统的差异，分析了几种入侵检测系统的检测率和误报率．

        基于数据挖掘技术的电力入侵检测系统防护结构及性能分析 (2010年)
       0 23浏览

        会员免费
      
基于数据挖掘技术，采用跨行业数据挖掘过程标准(CRISP-DM)的6个阶段，架构电力决策支持系统的数据挖掘过程．同时，针对电力决策支持的不同应用领域，如安全稳定性评估、电力负荷预测、电力系统故障分析和电力营销策略支持等，选取合适的数据挖掘算法进行应用分析．

        数据挖掘在电力决策支持系统中的应用 (2010年)
       0 42浏览

        会员免费
      
JupyterNotebook
大小：9MB
天池-安泰杯跨境电商智能算法大赛 冠军方案分享
赛题
AliExpress是阿里巴巴海外购物网站，海外用户可以在AliExpress挑选购买自己心意的商品。AliExpress积累了大量的用户行为数据，本赛题旨在通过海量数据挖掘用户下一个可能交互商品，选手们可以提交预测的TOP30商品列表，排序越靠前命中得分越高。
赛题数据
根据零售行业的人货场概念，赛题提供了关于用户行为日志的常见字段可分为如下部分：
用户：用户标识、用户国籍
商品：商品标识、店铺、品类、价格
场景：点击时间、访问排序、购买标记
评分公式MRR(Mean Reciprocal Rank)：
赛题分析
通过对赛题数据进行探索和分析，我们发现可以根据预测商品是否在历史交互过分成两种不同分布的用户：
历史交互用户：即预测商品用户曾经已交互过，在召回-排序阶段：
召回：可通过buy_flag=1，将交互商品全量召回
排序：基于用
天池-安泰杯跨境电商智能算法大赛 冠军方案分享
赛题
AliExpress是阿里巴巴海外购物网站，海外用户可以在AliExpress挑选购买自己心意的商品。AliExpress积累了大量的用户行为数据，本赛题旨在通过海量数据挖掘用户下一个可能交互商品，选手们可以提交预测的TOP30商品列表，排序越靠前命中得分越高。
赛题数据
根据零售行业的人货场概念，赛题提供了关于用户行为日志的常见字段可分为如下部分：
用户：用户标识、用户国籍
商品：商品标识、店铺、品类、价格
场景：点击时间、访问排序、购买标记
评分公式MRR(Mean Reciprocal Rank)：
赛题分析
通过对赛题数据进行探索和分析，我们发现可以根据预测商品是否在历史交互过分成两种不同分布的用户：
历史交互用户：即预测商品用户曾经已交互过，在召回-排序阶段：
召回：可通过buy_flag=1，将交互商品全量召回
排序：基于用

        Tianchi-AntaiCup-International-E-commerce-Artificial-Intelligence-Challenge:安泰杯国际电子商务人工智慧挑战赛的第一名解决方案
       0 149浏览

        会员免费
      
文章介绍了粗糙集的发展现状和相关概念，指出特征选择是运用粗糙集理论进行数据挖掘中最重要的一个环节；利用已求得的正区域和限制正域使处理数据的范围不断缩小从而减少求约简的时间，最后通过对形状进行知识约简，验证了用这个方法进行形状分析是可行的。

        改进的特征选择算法在形状分析中的应用 (2012年)
       0 51浏览

        会员免费
      
以数据挖掘技术中的“概念分层”和改进的“特尔菲算法”为基础,对云南“三江并流带”的旅游地质资源进行分析、整理和特征化描述,构造了旅游地质资源各评价层因子的星型数据库模式。研制出一个基于Windows操作系统的、以面向对象的具有较强开发能力的DEL-PHI7.0为开发工具的、以Access 2000作为后台数据库的旅游地质资源自动评价系统。完成了资源的定量化评价,实现了评价结果的可视化和地质资源的旅游化。

        基于“概念分层”结构的旅游地质资源评分系统的开发 (2004年)
       0 41浏览

        会员免费
      
论述了入侵检测系统的基本概念，针对目前入侵检测系统中存在的问题，提出了一个基于数据挖掘技术的自适应入侵检测系统模型。介绍了该系统模型的基本思想，阐述其结构及主要功能，着重分析了该系统的数据挖掘和检测过程。利用数据挖掘技术自动地从大量数据中提取重要的特征和新的模式，生成有意义的规则并建立检测模型，实现对分布式拒绝服务攻击DDoS（Distrbute Denial of Service）入侵的检测方法。

        数据挖掘技术在网络入侵检测中的应用 (2006年)
       0 39浏览

        会员免费
      
python
大小：743KB
python数据分析演示代码，压缩包内包含数据集和源码，代码文件格式为.ipynb，使用jupyter编辑，如有侵权请联系删除！！！
python数据分析演示代码，压缩包内包含数据集和源码，代码文件格式为.ipynb，使用jupyter编辑，如有侵权请联系删除！！！

        python数据分析演示代码（含数据集）.zip
       5 324浏览

        会员免费
      
关联规则是数据挖掘中的重要研究内容之一，国内现有的关联规则算法大多是研究挖掘数据库不变的限定条件下，发现挖掘数据的各属性间的所有关联型知识。而事实上大多数挖掘数据会随时间的变化不断变化。针对数据库中追加数据时，如何有效地更新关联规则的问题，提出了一种新算法--IUAMAR算法。该算法可以有效地利用知识数据库中保留的最小非高频繁项目集产生新的候选项目集，避免了候选项目集的数量太庞大的问题。

        关联规则增量式更新算法的研究* (2006年)
       0 31浏览

        会员免费
      
在大规模的文件存储系统中，针对大多数算法的设计没有考虑到元数据访问的特征与元数据本身较小的特点，提出了一种利用存储系统中的元数据操作日志文件，运用3元(3

        基于3-gram模型和数据挖掘技术的元数据预取 (2008年)
       0 32浏览

        会员免费
      
大规模的数据挖掘如聚类问题迫切需要大量计算，提出了自适应微粒群优化的并行聚类算法。通过从多种群并行地开始搜索，基于群体搜索技术的微粒群优化算法减少了初始条件的影响，采用任务并行和部分异步通信策略，降低计算时间。结合并行微粒群算法的自适应参数动态优化特性，克服群体逐渐失去迁移性而停止进化的问题，保持群体多样性从而了避免种群退化。仿真实验证明，该算法在并行机群上运行时，加快了聚类算法的计算速度，提高了聚类质量。

        一种并行自适应微粒群聚类算法 (2008年)
       0 40浏览

        会员免费
      
模糊粗糙集的知识约简是模糊粗糙集理论的核心内容之一,从增量式的数据、海量数据或动态数据中挖掘出人们感兴趣的知识,是数据挖掘研究的一个重点,也是一个难点.首先,给出模糊粗糙集的属性重要度的定义及属性约简的定义;其次,从F-粗糙集及并行约简出发,并结合模糊粗糙集的属性重要度,提出了F-模糊粗糙集及其约简,为增量式或动态模糊决策表的属性约简提供了一种有效的方法;最后,通过实例验证了F-模糊粗糙集及其约简的可行性.

        F-模糊粗糙集及其约简* (2015年)
       0 70浏览

        会员免费
      
生存时间预测在医学、经济和工程等领域有着广泛的应用。随着机器学习技术和数据挖掘技术的发展和广泛应用,研究人员提出了很多基于机器学习技术的生存时间预测算法。这些算法虽然都取得了良好的效果，但预测精度均有提升的空间。因此，提出了一种基于二次学习风范的生存时间预测算法，并结合最近邻算法在截尾样本估计上的应用以及支持向量机在泛化性能上的优势，实现了对临床生存时间的建模。实验结果表明，该算法能够获取精确的生存时间，且具有预测精度上的性能优势。

        应用于临床生存时间预测的二次学习算法研究-- (2014年)
       0 34浏览

        会员免费
      
ICU病人生死预测一直都是医学界的研究热点和难点。数据挖掘的机器学习方法近年来在该领域取得了一定的进展,但依然有很大的发展空间。针对ICU时序数据的高维度和不确定间隔采样特性,提出了不确定间隔采样转化为确定间隔的空采样的思想和相应的处理策略;在此基础上将传统的时间序列聚类与机器学习方法相结合,提出了一个两阶段的混合多机器学习算法框架,使得数据集的高维和不确定性得到了约简,从而可以采用经典的机器学习方法挖掘病人生死知识。在一个公开数据集上的两组实验结果表明,基于该算法框架的ICU病人死亡预测方法对于少数样本

        混合多机器学习的ICU病人生死预测框架-- (2014年)
       0 61浏览

        会员免费
      
随着计算机软件的规模不断扩大，手工获取、开发和维护软件所需的信息越来越困难。数据挖掘技术可从软件工程数据中自动发现所需信息，加快软件开发进程。对软件工程数据挖掘的研究进展进行了综述。概述了软件工程数据挖掘的基本概念与技术挑战；详细评述了在软件工程各个阶段，数据挖掘技术所能发现的信息/知识，以及获取这些信息/知识的意义、难点、步骤和方法，重点介绍了数据预处理和数据表示方法；对软件工程数据挖掘研究的发展趋势进行了展望。

        软件工程数据挖掘研究进展* (2012年)
       0 39浏览

        会员免费
      
数据挖掘算法处理海量数据时，扩展性受到制约。在商业和科学研究的各个领域，知识发现的过程和需求差异较大，需要有效的机制来设计和运行各种类型的分布式数据挖掘应用。提出了一种面向服务的云数据挖掘引擎的框架CloudDM。不同于基于网格的分布式数据挖掘框架，CloudDM利用开源云计算平台Hadoop处理海量数据的能力，以面向服务的形式支持分布式数据挖掘应用的设计和运行，并描述面向服务的云数据挖掘引擎系统的关键部件和实现技术。依据面向服务的软件体系结构和基于云平台的数据挖掘引擎，可以有效解决海量数据挖掘中的海量数

        面向服务的云数据挖掘引擎的研究* (2012年)
       0 54浏览

        会员免费
      
粗糙集和概念格是两种不同的知识发现和数据挖掘有效工具,已被广泛应用于许多领域。在对粗糙集和 概念格基本理论研究基础上,提出了利用扩展粗糙集模型对概念格近似使其得以改进,即在概念格中引入β-多数 蕴涵关系实现概念格中结点近似合并以及近似概念格( ACL)的构建,由此提出概念格粗糙近似和规则挖掘算法 ( LCRA)。最后通过 UCI机器学习数据库相关测试表明该算法的可行性和有效性。

        基于扩展粗糙集模型的近似概念格规则挖掘研究 (2009年)
       0 42浏览

        会员免费
      
本文基于数据挖掘技术,组建高效群组,采用一个能够监测群组成员间交流情况的系统使学员之间的交流更加便利,以帮助教师们改进网络群组学习。实验观察结果与数据证明了此理论是有效与可行的。

        网络学习中群组方法的研究 (2012年)
       0 42浏览

        会员免费
      
特色建筑凝结了历史的变迁与文化的发展，为了更好的保护与展示这些宝贵的文化资源，文章利用增强现实(AR)技术与数据挖掘技术重现建筑在不同时代的外观与特色，同时系统也智能提供了个性化建筑资料，这可让使用者全方位的认识特色建筑的历史。系统经过用户实际使用，反馈效果良好，不仅有结合用户兴趣的个性化信息互动，而且有效的保护并展示特色建筑的风格特点。

        增强现实技术在特色建筑观赏系统中的应用 (2013年)
       0 40浏览

        会员免费
      
随着网络技术、通信技术等的不断突破，互联网、移动网、广电网等多种类现代网络及其衍生业务迅速扩张，形成泛在于网络空间的分布式计算环境。为了最大化这些数据的价值，需要利用数据挖掘技术发现其中隐藏的模式或规则，用以指导和辅助生产或运营中的管理决策行为，以提高决策水平及决策收益。然而，受到普遍存在的异构性、私有性和平台兼容性等限制，兼因行业竞争和法律约束等因素(如个人或企业的数据隐私保护问题等)，互联于网络的数据源难于进行集中式挖掘，分布式数据挖掘(DDM)技术应运而生。介绍了DDM的定义与框架、适用场景和研究挑

        分布式数据挖掘综述 (2014年)
       0 67浏览

        会员免费
      
使用数据挖掘算法检测学生程序中的窃

        使用数据挖掘算法检测学生程序中的窃
       0 12浏览

        会员免费
      
实时大数据
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的中国工商企业数据库查询软件v2.5.1下载
       0 114浏览

        会员免费
      
海量数据挖掘
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的企业黄页电话查询软件v3.0下载
       0 58浏览

        会员免费
      
实时大数据
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的新工商名录查询软件v1.0下载
       0 85浏览

        会员免费
      
实时大数据
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的全国工商信息查询软件v2.1.1下载
       0 89浏览

        会员免费
      
***数据挖掘应用.ppt***

        ***数据挖掘应用.ppt***
       0 122浏览

        会员免费
      
数据挖掘软件的发展简介

        数据挖掘软件的发展.ppt
       0 69浏览

        会员免费
      
C4.5, k-Means, SVM, Apriori, EM, PageRank,AdaBoost, kNN, Naive Bayes,CART
（仅为简介）

        数据挖掘十大经典算法初探.ppt
       0 156浏览

        会员免费
      
1.基本概念及购物篮分析 2.Apriori算法及FP树（共107页）

        ****关联分析.ppt****
       0 90浏览

        会员免费
      
1.历程 2.预处理及相关算法 3、软件及应用 （概述，共119页）

        ***数据挖掘概述.ppt***
       0 116浏览

        会员免费
      
python
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的河南新注册企业查询软件v4.0.rar
       0 89浏览

        会员免费
      
1.数据清理 2.数据集成和变换 3.数据归约

        *****数据预处理.ppt*******
       0 92浏览

        会员免费
      
saas
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的河南新工商查询软件v3.1下载
       0 67浏览

        会员免费
      
海量数据挖掘
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发工商信息查询软件v2.0下载
       0 91浏览

        会员免费
      
要介绍主流的大数据技术架构和大数据挖掘技术;阐述大数据技术在精准营销与维系系统建设中的应用,包括技术实现方式以及大数据能力的体现,最后展望大数据应用的前景。

        大数据技术在精准营销中的应用 (2014年)
       0 101浏览

        会员免费
      
Python
大小：39KB
数据挖掘
1. Proballers数据挖掘项目
该项目是用于刮除Proballers网站的工具。
 目录：
 背景
模块清单
如何运行代码并创建数据库
数据库概述
原料药
背景： Proballers网站提供有关篮球的全球数据，更新和见解。 它使用户可以访问过去和最近获得的大量工作人员，球员资料，球队花名册，联赛得分和积分榜。
 该软件包可以抓取球员资料，联赛和比赛，球队，比赛结果和球员统计数据。 数据存储在数据库中，该数据库可以轻松地与其表一起创建。
2.模块清单：
 刮板：具有4个主要功能：
 - scrape_players: scrape players profiles to create players table.
- scrape_teams: scrape team pages to create teams table.
- scrape_games: scrape 
数据挖掘
1. Proballers数据挖掘项目
该项目是用于刮除Proballers网站的工具。
 目录：
 背景
模块清单
如何运行代码并创建数据库
数据库概述
原料药
背景： Proballers网站提供有关篮球的全球数据，更新和见解。 它使用户可以访问过去和最近获得的大量工作人员，球员资料，球队花名册，联赛得分和积分榜。
 该软件包可以抓取球员资料，联赛和比赛，球队，比赛结果和球员统计数据。 数据存储在数据库中，该数据库可以轻松地与其表一起创建。
2.模块清单：
 刮板：具有4个主要功能：
 - scrape_players: scrape players profiles to create players table.
- scrape_teams: scrape team pages to create teams table.
- scrape_games: scrape 

        data_mining:Proballers数据挖掘
       0 44浏览

        会员免费
      
university
大小：701KB
约束编程：
内容
推介会 ：
借助求解程序包，该应用程序可以从不同类型的约束条件中查找满足约束条件的房屋计划。 然后，借助计划包，该程序可以找到要执行的最优化的操作套件。 然后，我们形成满足约束条件的房屋的数据库，然后借助数据挖掘程序包提取有趣的信息。 L3计算机科学，分数：18/20。
用 ：
编译项目：
 javac -cp "src/tests/dataminingtests.jar:src/tests/solvertests.jar:src/tests/planningtests.jar:src/tests/representationtests.jar" -d build/ src/*/*.java 
运行项目：
 java -cp build/ examples.HouseDemo 
手术：
 这4个软件包构成一个库，使您可以进行约束编程。
表示
表示部分允许您创建问题的变量（
约束编程：
内容
推介会 ：
借助求解程序包，该应用程序可以从不同类型的约束条件中查找满足约束条件的房屋计划。 然后，借助计划包，该程序可以找到要执行的最优化的操作套件。 然后，我们形成满足约束条件的房屋的数据库，然后借助数据挖掘程序包提取有趣的信息。 L3计算机科学，分数：18/20。
用 ：
编译项目：
 javac -cp "src/tests/dataminingtests.jar:src/tests/solvertests.jar:src/tests/planningtests.jar:src/tests/representationtests.jar" -d build/ src/*/*.java 
运行项目：
 java -cp build/ examples.HouseDemo 
手术：
 这4个软件包构成一个库，使您可以进行约束编程。
表示
表示部分允许您创建问题的变量（

        ArchitectApp:架构应用程序，AI驱动的决策制定，实施算法（BFS，DFS，回溯，约束，Djikstra，MAC，启发式...）
       0 51浏览

        会员免费
      
机构选型多级模糊评判的核心计算是实现隶属度转换 ;但是 ,现有隶属度转换方法包含冗余性 ,表现在指标隶属度中对目标分类不起作用的冗余部分也被用于计算目标隶属度 .为此 ,用基于熵的数据挖掘方法 ,通过挖掘隐藏在各指标隶属度中关于目标分类的知识信息定义指标区分权 ;用区分权清除指标隶属度中对目标分类不起作用的冗余数值并提取有效值 ;有效值经指标重要性权重转化为可比值 ;用可比值计算目标隶属度实现隶属度转换 . 由此建立机构选型的改进模糊评判模型 .

        机构选型的改进多级模糊综合评判 (2009年)
       0 34浏览

        会员免费
      
C++
大小：14MB
百富勤：模式感知图挖掘系统
 Peregrine是一种高效的单机系统，用于在大型图形上执行数据挖掘任务。 一些图挖掘应用程序包括：
 查找频繁的子图
生成图案/小图分布
查找子图的所有出现
Peregrine是高度可编程的，因此您可以使用其新颖的，声明性的，以图形模式为中心的API轻松开发自己的图形挖掘应用程序。 要编写Peregrine程序，您需要描述您对挖掘感兴趣的图形模式，以及每次出现这些模式时应采取的措施。 您提供内容，运行时处理方式。
 有关完整的详细信息，您可以阅读我们在或上较长版本发布的论文。
 有关详细的摘要，请观看视频演示：
 TL; DR：与其他最先进的开源图形挖掘系统相比，Peregrine：
 执行速度提高700倍
消耗多达100倍的内存
扩展到100倍大数据集
在减少8倍的机器上
使用更简单，更具表现力的API
目录
1.快速入门
Peregrine已在Ubunt
百富勤：模式感知图挖掘系统
 Peregrine是一种高效的单机系统，用于在大型图形上执行数据挖掘任务。 一些图挖掘应用程序包括：
 查找频繁的子图
生成图案/小图分布
查找子图的所有出现
Peregrine是高度可编程的，因此您可以使用其新颖的，声明性的，以图形模式为中心的API轻松开发自己的图形挖掘应用程序。 要编写Peregrine程序，您需要描述您对挖掘感兴趣的图形模式，以及每次出现这些模式时应采取的措施。 您提供内容，运行时处理方式。
 有关完整的详细信息，您可以阅读我们在或上较长版本发布的论文。
 有关详细的摘要，请观看视频演示：
 TL; DR：与其他最先进的开源图形挖掘系统相比，Peregrine：
 执行速度提高700倍
消耗多达100倍的内存
扩展到100倍大数据集
在减少8倍的机器上
使用更简单，更具表现力的API
目录
1.快速入门
Peregrine已在Ubunt

        peregrine:百富勤
       0 51浏览

        会员免费
      
ZIP
大小：1KB
你好呀 :waving_hand:
 :grinning_face_with_big_eyes: 我是ViveVinushanth，本科，系。 莫拉图瓦大学计算机科学与工程学院。
 :office_building: 我目前是@ WSO2（身份服务器团队）的软件工程师。
 :telescope: 目前正在从事：基于人类影响的威胁预测
 :seedling: 我目前正在学习：机器学习，深度学习和NN，数据挖掘
 :speech_balloon: 向我询问：IAM，CIBA，EG-SMOTE
 :black_nib: 我的博客： 
 :closed_mailbox_with_raised_flag: 如何联系我： 
 :bird: 我在Twitter：
 最新博客：
你好呀 :waving_hand:
 :grinning_face_with_big_eyes: 我是ViveVinushanth，本科，系。 莫拉图瓦大学计算机科学与工程学院。
 :office_building: 我目前是@ WSO2（身份服务器团队）的软件工程师。
 :telescope: 目前正在从事：基于人类影响的威胁预测
 :seedling: 我目前正在学习：机器学习，深度学习和NN，数据挖掘
 :speech_balloon: 向我询问：IAM，CIBA，EG-SMOTE
 :black_nib: 我的博客： 
 :closed_mailbox_with_raised_flag: 如何联系我： 
 :bird: 我在Twitter：
 最新博客：

        VivekVinushanth
       0 36浏览

        会员免费
      
不完备数据是造成信息系统不确定的主要原因之一，对数据挖掘、知识发现等造成了困难。本文提出一种基于最小描述长度原则的不完备数据处理方法，实例证明这种方法是有效的。R08e工具的规则提取结果证明此方法在规则的集中性和支持度方面优于粗糙集辨识矩阵方法和Conditioned mean completer方法。

        基于最小描述长度的不完备数据处理 (2006年)
       0 43浏览

        会员免费
      
JupyterNotebook
大小：1MB
数据挖掘
一期
第二阶段
第二阶段
数据挖掘
一期
第二阶段
第二阶段

        mineriadedatos
       0 25浏览

        会员免费
      
实时大数据
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的工商数据查询软件v7.1下载
       0 102浏览

        会员免费
      
为了解决数据挖掘过程中挖掘的知识粒度过粗或过细问题，并利用概念格的偏序特性，提出了一种基于量化概念格的属性归纳算法。首先对概念格的外延进行量化，得到量化概念格，再根据概念格的哈斯图，采用概念的爬升进行相应的泛化，从而获得基于量化概念格的多层、多属性归纳。与面向属性归纳（AOI）算法相比较，结果表明所提算法不仅能实现AOI的单一属性归纳，还能进行多层、多属性的归纳，其属性泛化的路径不是惟一的，并且很容易在量化概念格的哈斯图中寻找合适的泛化路径和阈值，以此得到用户要求的、合理的属性归纳结果。

        一种新颖的基于量化概念格的属性归纳算法 (2007年)
       0 33浏览

        会员免费
      
实时大数据
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的高新企业信息查询软件v3.0下载
       0 72浏览

        会员免费
      
数据分析
大小：42MB
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。
这个软件是通过scrapy爬虫框架结合代理IP池再加上request模拟请求技术以及验证码识别技术，可以做到日更新采集全国新工商信息。采集的数据自动存储在mysql数据库表里，可下载全量1.8亿多企业工商基本信息和36维度的详细信息.支持sql和excel导出数据包格式。

        基于python开发的新企业数据查询软件v2.1.1下载
       0 116浏览

        会员免费
      
开源软件
大小：319KB
Envision是基于MySQL和Weka的用于业务Analisys和建模的数据挖掘工具。 它完全基于Web / Java，易于使用。 由Anthas Consulting提供。
Envision是基于MySQL和Weka的用于业务Analisys和建模的数据挖掘工具。 它完全基于Web / Java，易于使用。 由Anthas Consulting提供。

        Envision-开源
       0 43浏览

        会员免费
      
saas
大小：42MB
这是基于python爬虫技术编程写的关单数据爬虫系统，实现全球海关、关单、外贸数据的爬取。框架采用python多线程技术+request+代理IP池,实现了每天几十亿家采购商供应商外贸和关单数据实时采集和更新。
这是基于python爬虫技术编程写的关单数据爬虫系统，实现全球海关、关单、外贸数据的爬取。框架采用python多线程技术+request+代理IP池,实现了每天几十亿家采购商供应商外贸和关单数据实时采集和更新。

        基于python开发的关单数据爬虫系统v4.2下载
       0 119浏览

        会员免费
      
聚类分析是重要的数据挖掘方法，在商务智能、地理信息系统、医学等方面有广泛的应用．随着聚类分析的蓬勃发展，涌现出了许多聚类算法，其中最重要的算法之一是基于密度的空间聚类以及其多种变种——基于密度连通链、基于加权密度、基于引力连通集合的算法．这些算法在概念上相似但没有统一的描述．本文针对基于密度的空间聚类及其变种提出了拓扑的概念．给出了聚类拓扑结构的定义，把簇定义为拓扑连通集合．此外，本文运用全新的拓扑思想改进典型的算法，提出了一种拓扑聚类的新算法．实例证明此算法有效．

        基于拓扑聚类的密度聚类算法研究* (2007年)
       0 78浏览

        会员免费
      
Python
大小：7KB
房屋价格预测
建立住房价格预测系统模型并提供购买咨询服务：一种计量经济学方法住房价格是住房市场稳定的重要指标。 预测房价变化可以帮助您了解房地产市场，这就是房主，房地产开发商和政府始终关注房价趋势的原因。 预测房价不仅可以帮助政府调节住房市场，还可以帮助房地产开发商在投资中做出正确的决定。 住房投资者的决定很大程度上取决于未来的房价预测。 在本研究中，我们打算使用Kegel网站1990年至2010年的数据对波士顿州的房价进行建模和预测。为此，我们使用了各种回归模型，包括线性回归和更高级的回归，例如Lasso和Ridge是计量经济学建模和预测中使用最广泛的方法之一。 此外，通过使用数据挖掘方法选择和考虑有效因素，我们选择了最佳建议的模型，即使用Dropna和逐步方法的Lasso模型，训练数据的准确性为91％，测试数据的准确性为86％。 此外，模型上的各种回归测试已被忽略，以实现最佳结果和最小
房屋价格预测
建立住房价格预测系统模型并提供购买咨询服务：一种计量经济学方法住房价格是住房市场稳定的重要指标。 预测房价变化可以帮助您了解房地产市场，这就是房主，房地产开发商和政府始终关注房价趋势的原因。 预测房价不仅可以帮助政府调节住房市场，还可以帮助房地产开发商在投资中做出正确的决定。 住房投资者的决定很大程度上取决于未来的房价预测。 在本研究中，我们打算使用Kegel网站1990年至2010年的数据对波士顿州的房价进行建模和预测。为此，我们使用了各种回归模型，包括线性回归和更高级的回归，例如Lasso和Ridge是计量经济学建模和预测中使用最广泛的方法之一。 此外，通过使用数据挖掘方法选择和考虑有效因素，我们选择了最佳建议的模型，即使用Dropna和逐步方法的Lasso模型，训练数据的准确性为91％，测试数据的准确性为86％。 此外，模型上的各种回归测试已被忽略，以实现最佳结果和最小

        HousePricePrediction
       0 67浏览

        会员免费
      
JupyterNotebook
大小：237MB
CMI-Course-Work-2020-22
 第一学期
数学方法分析（DG1101）
 R的概率与统计（DG1102）
 使用Python进行编程和数据结构（DG1103）
 离散数学（DG 1104）
 RDBMS，SQL和可视化（DG1105）
 线性代数（DG1201）
 第二学期
线性代数（DG1201）
 数据挖掘和机器学习（DG1202）
 算法（DG1203）
 分布式计算（DG1204）
 使用Hadoop大数据（DG1205）
CMI-Course-Work-2020-22
 第一学期
数学方法分析（DG1101）
 R的概率与统计（DG1102）
 使用Python进行编程和数据结构（DG1103）
 离散数学（DG 1104）
 RDBMS，SQL和可视化（DG1105）
 线性代数（DG1201）
 第二学期
线性代数（DG1201）
 数据挖掘和机器学习（DG1202）
 算法（DG1203）
 分布式计算（DG1204）
 使用Hadoop大数据（DG1205）

        CMI-Course-Work-2020-22:该资料库是关于我在CMI参加的课程的全部内容。 它包括一些讲义，已解决的作业以及在Midsem和Finalsem考试中我的原始答题纸
       0 43浏览

        会员免费
      
由于传统网络管理体系较少考虑互联网的社会性，因而对互联网的管理问题缺乏充分支持，互联网秩序正在遭受不良上网行为和不良信息的严重挑战，网络管理的主要矛盾也正在由网络基础设施管理转变为网络用户行为管理。现有的过滤策略等被动防御措施无法从根本上解决网络用户行为管理的问题。本文研究基于信用评估的网络管理方法，把金融领域的信用评估思想引入到网络用户行为管理中，实现对不良用户行为的主动调控，达到降低网络管理成本、提高网络管理水平的目的。并结合网络技术、数据挖掘等相关领域的研究成果，设计并实现了适合互联网管理特点的网络

        基于信用的网络管理系统设计和实现 (2011年)
       0 29浏览

        会员免费
      
以河北省的136个县为研究对象,选取综合经济实力、从业方式、生活水平、第一产业发展状况、第二产业发展状况、第三产业发展状况为县域经济发展评价指标,采用Poly Analyst数据挖掘软件进行聚类分析,研究河北省县域经济发展的特点与差异。研究结果表明,在合理选取评价指标的基础上,数据挖掘技术中的聚类分析方法能够有效地发现县域经济发展的相似与相异性,为研究其经济发展状况提供更多的科学依据。

        聚类分析在县域经济发展研究中的应用 (2012年)
       0 53浏览

        会员免费
      
传统的网络性能评估手段无法做到对于用户感知的准确评估，需要采用新的手段，准确地评估手机用户对于网络质量的感知情况，在此基础上进行综合分析，为市场营销提供支撑。“用户感知评估体系”软件是基于GSM网络中A接口信令采集数据，以信令关联技术和数据挖掘的分析方法为基础，设计并实现提升用户感知性能的评估软件。通过用户感知评估体系的设计与实现，从全新的视角分析手机用户和移动市场，从而为移动市场营销及业务推广提供全面支撑，以及针对重点客户群进行感知网络性能的网络优化。

        用户感知评估体系的设计与实现 (2009年)
       0 49浏览

        会员免费
      
信息资源的分析、整合在引进人才的竞争中起着越来越重要的作用。数据挖掘作为一种系统地检查和理解大量数据的工具，能有效地帮助高校及各企事业单位从不断积累与更新的数据中提取有价值的信息。因此，数据挖掘被引入到人才市场研究领域，并日益受到重视。从数据挖掘在人才竞争中的市场研究价值入手，探讨了数据挖掘在引进人才研究尤其是引进高层次人才中的应用，并给出了应用实例。

        数据挖掘在人才引进中的应用 (2005年)
       0 35浏览

        会员免费
      
Web服务以其高度集成性、松散耦合性等特点倍受大众青睐，但伴随着网络的快速发展，Web服务的不安全因素成了阻碍其发展的瓶颈．本文主要为应用中的Web服务安全提供一个解决方案．核心解决方法是使用数据挖掘的DAR算法设计出一个安全引擎，以挖掘出存储在数据库中各项数据间的关联规则，对新进的SOAP消息进行预测．实验结果表明，Web服务系统对消息的攻击防御能力得到了很大的提高．这说明使用数据挖掘的DAR算法能够为Web服务提供一定的安全保障．

        基于DAR算法的Web服务安全研究* (2013年)
       0 60浏览

        会员免费
      
数据挖掘方法的人工神经网络是一种新的数学建模方式．传统方法对非线性数据的预测不易找到简单而有效的模型，神经网络的提出为处理非线性问题提供了比较好的方法．针对BP算法的局限性提出了改进的BP网络模型，通过对CSP质量指标的预测结果与传统的BP模型比较，结果表明，改进的BP算法提高了学习效率，网络有较好的泛化能力，而且预测更可靠．

        基于数据挖掘的BP神经网络模型的一种改进算法* (2008年)
       0 53浏览

        会员免费
      
自然科学
大小：3MB
以Landsat TM遥感影像为数据源,用本文提出的方法对渤海区域进行了检测。首先根据初始时刻影像(例如2001年影像)检测出海水区域,即感兴趣区域,然后以终止时刻影像(例如2007年影像)的同一感兴趣区域为研究对象,检测其中的陆地区域,即围填海区域。为了能够检测出围填海区域,采用数据挖掘中的关联规则算法,挖掘了围填海检测规则。为了验证本文提出的围填海区域检测方法的有效性,以整个渤海为研究区域,采用挖掘出的检测规则对待检测影像进行围填海区域检测,检测结果表明本文提出的检测方法能较高精度的检测出围填海区域。
以Landsat TM遥感影像为数据源,用本文提出的方法对渤海区域进行了检测。首先根据初始时刻影像(例如2001年影像)检测出海水区域,即感兴趣区域,然后以终止时刻影像(例如2007年影像)的同一感兴趣区域为研究对象,检测其中的陆地区域,即围填海区域。为了能够检测出围填海区域,采用数据挖掘中的关联规则算法,挖掘了围填海检测规则。为了验证本文提出的围填海区域检测方法的有效性,以整个渤海为研究区域,采用挖掘出的检测规则对待检测影像进行围填海区域检测,检测结果表明本文提出的检测方法能较高精度的检测出围填海区域。

        基于数据挖掘的遥感影像围填海智能检测方法研究 (2012年)
       0 35浏览

        会员免费
      
自然科学
大小：4MB
针对赤潮检测方法的及时性和普适性较差的问题,选取美国国家航空航天局(NASA)对地观测系统(EOS)所获取的多景MODIS遥感图像,经过光谱分析和特征选择获得所需数据集,采用数据挖掘技术训练赤潮检测的决策树分类模型,抽取赤潮分类规则。通过对2004年5到6月份一次赤潮爆发周期内获取的8景MODIS遥感影像的赤潮检测,验证了利用挖掘出的分类规则对渤海黄河入海口及邻近海域所发生的赤潮进行检测可取得较满意的结果。
针对赤潮检测方法的及时性和普适性较差的问题,选取美国国家航空航天局(NASA)对地观测系统(EOS)所获取的多景MODIS遥感图像,经过光谱分析和特征选择获得所需数据集,采用数据挖掘技术训练赤潮检测的决策树分类模型,抽取赤潮分类规则。通过对2004年5到6月份一次赤潮爆发周期内获取的8景MODIS遥感影像的赤潮检测,验证了利用挖掘出的分类规则对渤海黄河入海口及邻近海域所发生的赤潮进行检测可取得较满意的结果。

        基于决策树的MODIS影像赤潮智能检测技术 (2012年)
       0 85浏览

        会员免费
      
自然科学
大小：468KB
由于制造系统的复杂性和不确定性,单一的知识建模或数据挖掘建模都面临着知识或数据信息的不完备.为有效、充分地利用已有信息减少不确定性,文中提出了知识和数据挖掘相融合的建模思想,将知识嵌入到粗糙集模型中,建立了知识的函数关系,给出了基于不可分辨-函数关系的粗糙集决策模型,研究了不可分辨-函数关系下的知识分类和推理.相比原粗糙集模型,基于知识的粗糙集模型具有更高的划分精度,发现知识更丰富,结构形式更具归纳性.实验结果验证了决策模型的有效性和应用的灵活性.
由于制造系统的复杂性和不确定性,单一的知识建模或数据挖掘建模都面临着知识或数据信息的不完备.为有效、充分地利用已有信息减少不确定性,文中提出了知识和数据挖掘相融合的建模思想,将知识嵌入到粗糙集模型中,建立了知识的函数关系,给出了基于不可分辨-函数关系的粗糙集决策模型,研究了不可分辨-函数关系下的知识分类和推理.相比原粗糙集模型,基于知识的粗糙集模型具有更高的划分精度,发现知识更丰富,结构形式更具归纳性.实验结果验证了决策模型的有效性和应用的灵活性.

        制造决策的知识融合粗糙集模型 (2011年)
       0 52浏览

        会员免费
      
基于数据挖掘技术的入侵检测技术是近年来研究的热点，目前有不少入侵检测系统中都采用了关联分析的数据挖掘方法，现有的关联分析算法只能够解决数据中分类属性的挖掘，对于数值属性则不能直接使用，然而网络流量数据中包含了许多反映入侵状况的数值属性，已有学者提出了将数值属性先进行分类而后再进行关联分析的挖掘方法，然而这种方法带来的问题是在进行异常和正常划分时存在明确的界限，即“尖锐边界问题”，由于网络安全概念自身具有一定的模糊性，因此明确的界限可能会导致误报和漏报的情况产生，从而影响检测效果，文中提出了一种基于模糊关联

        基于模糊数据挖掘技术的入侵检测算法与应用 (2006年)
       0 36浏览

        会员免费
      

          1
        

          46
        

          47
        

          48
        

          49
        

          50
        
前往
页