Hadoop大数据挖掘从入门到进阶实战(视频教学版)
电子书推荐
-
社交网站的数据挖掘与分析 第2版 评分:
Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。 每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。 •获得对社交网络世界的直观认识 •使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据 •学习如何应用便捷的Python工具来交叉分析你所收集的数据 •通过XHTML朋友圈探讨基于微格式的社交联系 •应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术 •通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化
上传时间:2017-12 大小:51.92MB
- 7.26MB
《社交网站的数据挖掘与分析(原书第2版)[精品]》
2016-12-19此资源为电子书格式epub 电脑端需下载阅读软件
- 40.53MB
社交网站的数据挖掘与分析 第2版
2019-03-15Facebook、Twitter和LinkedIn产生了大量宝贵的社交数据,但是你怎样才能找出谁通过社交媒介正在进行联系?他们在讨论些什么?或者他们在哪儿?这本简洁而且具有可操作性的书将揭示如何回答这些问题甚至更多的问题。你将学到如何组合社交网络数据、分析技术,如何通过可视化帮助你找到你一直在社交世界中寻找的内容,以及你闻所未闻的有用信息。 每个独立的章节介绍了在社交网络的不同领域挖掘数据的技术,这些领域包括博客和电子邮件。你所需要具备的就是一定的编程经验和学习基本的Python工具的意愿。 •获得对社交网络世界的直观认识 •使用GitHub上灵活的脚本来获取从诸如Twitter、Facebook和LinkedIn之类的社交网络API中的数据 •学习如何应用便捷的Python工具来交叉分析你所收集的数据 •通过XHTML朋友圈探讨基于微格式的社交联系 •应用诸如TF-IDF、余弦相似性、搭配分析、文档摘要、派系检测之类的先进挖掘技术 •通过基于HTML5和JavaScript工具包的网络技术建立交互式可视化
- 58.81MB
社交网站的数据挖掘与分析
2017-11-11本书第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、 GitHub、邮件、网站和博客等)的数据,...
- 4.16MB
社交网站的数据挖掘与分析(原书第2版)【epub】
2019-04-17本书第2版对上一版内容进行了全面更新和修订,它将揭示回答这些问题的方法与技巧。你将学到如何获取、分析和汇总散落于社交网站(包括Facebook、Twitter、LinkedIn、Google+、GitHub、邮件、网站和博客等)的数据,...
- 2.49MB
完整版基于R语言的数据挖掘数据分析实操案例 2000到2015年豆瓣共47000部电影数据分析 从数据抓取到数据分析全流程案例 含源代码 共33页.pdf
2021-08-08【基于R语言的数据挖掘数据分析实操案例】 【2000到2015年豆瓣共47000部电影数据分析】 第一章 数据抓取 第二章 整理电影属性 第三章 整理电影属性 第四章 这样的图表才专业 ...第七章 社交网络数据挖掘
- 25.49MB
《新媒体数据挖掘——基于R语言》课件
2018-05-297 1.3 R在计算传播学中的典型应用 9 1.3.1 用R进行文本分析初探 9 1.3.2 互联网在线数据收集 10 1.3.3 社会网络分析 12 1.4 总结与提高 13 1.5 习题 14 第2章 R语言开发环境 15 2.1 R的获取、安装和基本使用 16 ...
- 145.61MB
零点城市社交电商 V1.6.3+公众号H5+支付宝+微信+头条+抖音小程序.rar
2022-07-10零点城市社交电商小程序致力于为大家提供集高颜值、多元化营方案,全渠道协助本地社交电商的拓新、促活、留存与转化,助力数据化营销运营,,深度挖掘城市生活电商生态,提供全渠道生活服务电商解决方案! 目前支持...
- 6.20MB
[详细完整版]交通大数据.pptx
2022-06-21大数据应用—交通 极端天气 偶发事件 …… 交通拥堵 ITS传感器网络 一卡通 手机定位 打车APP 实时拥堵状态 带位置标记的社交媒体数据 交通资源分配 打车难 钱难挣 实时人群密度 挖掘拥堵根源 收集需求大数据 实时...
- 101KB
SNA-Project1-SNAP:社交网络分析半课程的第一项任务的实施,这是理学硕士课程的一部分。 雅典经济贸易大学数据科学专业
2021-02-22该存储库保存了社会网络分析半课程的第一项任务的实施,这是硕士课程的一部分。 雅典经济贸易大学的数据科学博士学位。 作业概述 原始分配说明本身在此存储库中不可用; 但是,这是代码功能的概述。 我使用的是 ,...
- 162KB
01大数据概述.pdf
2022-12-24如:⼤数据发展⼯程师,操作⼯程师、⼤数据架构师、⼯程师、BI⼯程师、数据挖掘⼯程师、 ETL开发⼯程师、Spark开发⼯程师等等。 虽然⼤数据的就业前景很好,但掌握⼤数据开发技术也是前提。否则,不管这个⾏业发展得...
- 1.83MB
大数据网络营销.pptx
2022-12-24Agenda 大数据背景 大数据定义 大数据应用 大数据现状、趋势和展望 2 整理课件 大数据网络营销全文共18页,当前为第2页。 大数据背景 "大数据"的诞生 半个世纪以来,随着计算机和互联网技术全面融入社会生活,信息...
- 30KB
大数据PPT材料.docx
2022-12-24在中国市场,工信部发布的物联网"十二五"规划上,把信息处理技术作为4项关键技术创新工程之一提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。而另外 3 项关键技术创新...
- 113.92MB
apachecn-ds-zh:[译] ApacheCN 数据科学译文集
2021-05-05——《原则》,生活原则 5.6.c目录精通 NumPy 数值分析NumPy 数组学习手册精通 SciPyPandas 秘籍Pandas 学习手册中文第二版精通 PandasNumPy 和 Pandas 数据分析实用指南精通 Pandas 探索性分析Matplotlib 3.0 秘籍...
- 124KB
大数据研究综述.docx
2022-12-24大数据研究综述 摘要 :从大数据基本理论,大数据存储与分析处理技术和大数据应用研究三个角度说明当前研究热点,重点比较当前大数据处理工具的优缺点,并深入归纳总结了基于数据存储大数据处理技术,对未来研究进行...
- 31KB
赢在大数据.docx
2022-12-24上个月Vpon威朋推出了一款名为3S(Sales Supporting System)的系统广告分析系统,这是一套建立在Hadoop平台上的大数据挖掘、分析及处理系统。这套系统的最大作用是能精确地统计和分析用户点击移动应用的时间、地点...
- 1.95MB
ChatGPT教程(终极版)最全整理
2023-05-16这是一篇动了某些人利益的良心教程。 这是一篇姗姗来迟的ChatGPT教程。 纯小白关于ChatGPT入门,你看我这篇文章就够了。 如果你已经用上了ChatGPT,更要恭喜你挖到宝藏,后面的高级技巧一定能让你有收获。 文章包含以下内容: 一、ChatGPT是啥?有什么用; 二、ChatGPT如何注册; 三、ChatGPT使用方法; 四、用ChatGPT搞钱; 五、高级技巧;
- 58KB
博客中Kmeans以及FCM算法数据(免积分)
2023-05-16博客中Kmeans以及FCM算法的数据,包括IRIS鸢尾花数据集、Wine葡萄酒数据集、Seed小麦种子数据集、glass数据集、WDBD乳腺癌数据集,下载在直接存入项目文件夹即可,如果下载不了,可以私信我,看到后会及时回复。
- 1.25MB
hugging face的models-openai-clip-vit-large-patch14文件夹
2023-10-25用于无法访问hugging face并需要运行stable-diffusion-webui时使用
- 10KB
神经网络回归预测--气温数据集
2021-11-26神经网络回归预测--气温数据集
- 1.87MB
XGBoost+LightGBM+LSTM-光伏发电量预测
2022-12-24包含比赛代码、数据、训练后的神经网络模型等。 在分析光伏发电原理的基础上,论证了辐照度、光伏板工作温度等影响光伏输出功率的因素,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量,根据光伏电站DCS系统提供的实际发电量数据进行对比分析,验证模型的实际应用价值。 1 数据探索与数据预处理 1.1 赛题回顾 1.2 数据探索性分析与异常值处理 1.3 相关性分析 2 特征工程 2.1 光伏发电领域特征 2.2 高阶环境特征 3 模型构建与调试 3.1 预测模型整体结构 3.2 基于LightGBM与XGBoost的构建与调试 3.3 基于LSTM的模型构建与调试 3.4 模型融合与总结 4 总结与展望 参考文献
- 2.20MB
Mathwork+Matlab+编程手册
2023-08-25Introduction to Programming with MATLAB ~ Vanderbilt University
- 6.77MB
基于Python+pytorch的图像处理+附完整代码图像处理,能够轻松实现图像的读取、显示、裁剪等还有机器学习等操作
2024-04-17Python+PyTorch:图像处理界的“瑞士军刀” 在图像处理这个充满魔法的世界里,Python和PyTorch这对黄金搭档,就像一位技艺高超的魔法师和一把无所不能的“瑞士军刀”,总能轻松解决各种看似棘手的难题。它们以高效、灵活和强大的特性,引领着图像处理技术的发展潮流,让无数开发者为之倾倒。Python,这位优雅的魔法师,以其简洁易懂的语法和丰富的库资源,赢得了广大开发者喜爱。无论是数据处理、机器学习还是深度学习,Python都能轻松应对,展现出其无与伦比的魅力。在图像处理领域,Python更是如鱼得水,通过OpenCV、PIL等库,能够轻松实现图像的读取、显示、裁剪、缩放、滤波等操作,让图像在指尖起舞。而PyTorch,这把图像处理界的“瑞士军刀”,则以其灵活性和易用性,成为深度学习领域的翘楚。它拥有强大的自动求导功能,能够轻松构建和训练复杂的神经网络模型。在图像处理中,PyTorch能够助力开发者构建出各种高效的图像识别、分割、生成等模型,让图像焕发出新的生机。想象一下,当你掌握了Python和PyTorch这对黄金搭档,就如同掌握了一把魔法杖和一把瑞士军刀。必然大可作为
- 321KB
Stable-Diffusion WEBUI 简体中文语言包(2023.05.30更新)
2023-05-30AI绘图,Stable-Diffusion WEBUI,本地化(简体中文)语言文件。 原始文件来自翻译插件,根据自己实际使用情况,增加和修改了一些翻译。 配合【双语插件】看上去要自然一点,内容还在继续完善中。 本次增加了一些翻译内容,特别是插件。 同时继续合并了其它翻译插件的内容。 最近文字提示修改得有点多啊。 请放入“你的SDWebUI项目位置/localizations/”中。 中文翻译部分删掉了不少括起来的英文原文,所以别直接选它用。 请配合【Bilingual Localization】插件使用,双语同时显示,效果最好。
- 407KB
时间序列预测模型实战案例(Xgboost)(Python)(机器学习)包括时间序列预测和时间序列分类,点击即可运行!
2023-09-25内容概要 资源包括三部分(时间序列预测部分和时间序列分类部分和所需的测试数据集全部包含在内) 在本次实战案例中,我们将使用Xgboost算法进行时间序列预测。Xgboost是一种强大的梯度提升树算法,适用于各种机器学习任务,它最初主要用于解决分类问题,在此基础上也可以应用于时间序列预测。 时间序列预测是通过分析过去的数据模式来预测未来的数值趋势。它在许多领域中都有广泛的应用,包括金融、天气预报、股票市场等。我们将使用Python编程语言来实现这个案例。 其中包括模型训练部分和保存部分,可以将模型保存到本地,一旦我们完成了模型的训练,我们可以使用它来进行预测。我们将选择合适的输入特征,并根据模型的预测结果来生成未来的数值序列。最后,我们会将预测结果与实际观测值进行对比,评估模型的准确性和性能。 适合人群:时间序列预测的学习者,机器学习的学习者, 能学到什么:本模型能够让你对机器学习和时间序列预测有一个清楚的了解,其中还包括数据分析部分和特征工程的代码操作 阅读建议:大家可以仔细阅读代码部分,其中包括每一步的注释帮助读者进行理解,其中涉及到的知识有数据分析部分和特征工程的代码操作。
- 40.89MB
中文短信数据集-带标签
2024-02-05本数据集可用于进行文本分类、信息检索等自然语言处理实验,共包含80万条短信。其中:原始数据集data.txt每行为1条短信,格式为“标签\t短信内容”,标签=0表示正常短信,标签=1表示垃圾短信。train.csv和test.csv为拆分后的训练集与测试集,拆分代码为train_test_split.py。stopwords.txt为使用的停用词。 基于该数据集的文本分类详见文章https://blog.csdn.net/baidu_40395808/article/details/135793836,基于该数据集的信息检索详见文章https://blog.csdn.net/baidu_40395808/article/details/135897480。 示例如下: 0 商业秘密的秘密性那是维系其商业价值和垄断地位的前提条件之一 1 《依林美容》三.八.女人节倾情大放送活动开始啦!!!!超值套餐等你拿,活动时间x月x日一x月xx日, 详情进店咨询。美丽热线x
- 1.3MB
亚博K210模型训练部署
2023-07-11亚博K210模型训练部署
- 1.7MB
yolov8调用zed相机实现三维测距(版本一)
2024-04-16yolov8调用zed相机实现三维测距(版本一),具体内容见博客https://blog.csdn.net/qq_45077760?type=blog
- 174.14MB
Plecs电力电子仿真PLECS41.64 电力系统仿真软件免安装版本
2023-02-02超级容易学习的电力电子仿真软件。 PLECS是一个用于电路和控制结合的多功能仿真软件,尤其适用于电力电子和传动系统。 对于仿真Buck电路,Boost电路,单相整流电路,单相逆变电路,三相整流电路,三相逆变电路,LLC电路等都能够完美实现。并且能够直接使用C语言进行编程仿真,让代码直接写完以后完整运行到控制板中。 Plecs主要解决了Matlab Simulink仿真速度很慢,学习过程复杂和困难等问题。 Plexim在电力电子仿真领域处于世界领先地位。首要软件产品PLECS可以协助用户加快产品开发和创新流程。其优势来源于先进的编程技术,以及融合了非常规建模概念的仿真算法。通过认真听取工程师的需求和建议,我们能够为客户的今天和未来提供满意的解决方案。 从2002年开始,PLECS已经在众多工业领域成为电力电子仿真的标准。典型应用涵盖新能源,车辆电子,航空航天,工业及牵引驱动等。
- 1.29MB
基于鲸鱼优化算法优化VMD参数试看效果代码(目标函数为样本熵)
2022-10-301.采用鲸鱼算法优化VMD分解层数和惩罚系数的MATLAB代码,目标函数根据样本熵计算。直接运行,可以换数据。 2.核心算法加密,有需要请在CSDN联系作者。
- 20KB
机器学习期末复习题及答案
2023-03-19机器学习期末复习题及答案