VIP会员
作者:CSDN
出版社:CSDN《程序员》
ISBN:1111111111117
VIP会员免费
(仅需0.8元/天)
¥ 40000.0
温馨提示: 价值40000元的1000本电子书,VIP会员随意看哦!
电子书推荐
-
R语言与网站分析 评分:
目 录 前言 第1 章 统计思维与网站分析 1 1.1 不确定与确定 1 1.2 统计分析方法 4 1.2.1 细分分析 4 1.2.2 对比分析 6 1.2.3 趋势分析 7 1.3 网站分析概要 7 1.3.1 解决用户需求 7 1.3.2 寻找新的用户需求 10 第2 章 R 语言数据操作基础 11 2.1 R 简介 11 2.2 了解R 软件 11 2.2.1 软件安装 11 2.2.2 R 软件界面 12 2.2.3 工作目录 14 2.2.4 命令行交互 15 2.2.5 命令脚本文件 16 2.2.6 工作空间数据 16 2.2.7 帮助 17 2.2.8 R 语言入门 18 2.2.9 扩展算法包 19 2.3 R 语言的数据类型 21 2.4 对象及其属性 23 2.4.1 固有属性:模式和长度 24 2.4.2 读取和设置属性值 24 2.4.3 对象的搜索和删除 25 2.5 向量 26 2.5.1 创建向量 26 2.5.2 向量索引 26 2.5.3 向量编辑 29 2.5.4 向量排序 29 2.5.5 向量去重 30 2.5.6 缺失值处理 30 2.5.7 向量间操作 31 2.6 矩阵和数组 31 2.6.1 创建矩阵 32 2.6.2 矩阵索引 33 2.6.3 矩阵编辑 34 2.6.4 矩阵的运算 35 2.6.5 数组 37 2.6.6 apply 函数应用 38 2.7 列表和数据框 39 2.7.1 列表的创建和索引 39 2.7.2 列表编辑 40 2.7.3 数据框的创建和名称 40 2.7.4 数据框索引 41 2.7.5 数据框编辑 43 VII 2.7.6 缺失值处理 44 2.8 因子 44 2.8.1 无序和有序因子 45 2.8.2 连续数据的离散化 46 2.9 字符串操作 47 2.9.1 字符串长度 nchar 48 2.9.2 字符串合并和分割 48 2.9.3 字符串内部字符的读取 和替换 49 2.9.4 正则表达式 52 2.10 常用数据的创建 53 2.10.1 因子序列的创建 53 2.10.2 等差序列的创建 54 2.10.3 随机抽样 sample 54 2.10.4 重复序列 rep 55 2.10.5 概率分布 55 2.11 控制流 58 2.11.1 分支语句 58 2.11.2 循环语句 59 2.12 运算符、函数和过程 61 2.12.1 常用运算符 61 2.12.2 函数 62 2.12.3 过程 63 2.13 数据的读写等操作 64 2.13.1 读取数据 64 2.13.2 输出数据 68 第3 章 R 语言的绘图基础 69 3.1 概述 69 3.2 颜色以及文字/ 点/ 线参数的 设置 69 3.2.1 颜色 71 3.2.2 文字元素相关参数设置 76 3.2.3 点元素相关参数设置 77 3.2.4 线元素相关参数设置 79 3.3 低级绘图函数 80 3.3.1 引例 80 3.3.2 标题 81 3.3.3 图例 83 3.3.4 坐标轴 84 3.3.5 边框 88 3.3.6 网格线 89 3.3.7 点 90 3.3.8 线 91 3.3.9 文字 94 3.3.10 多边形 96 3.4 高级绘图函数以及常用绘图 应用 96 3.4.1 图形类型的选择 96 3.4.2 散点图 98 3.4.3 气泡图 100 3.4.4 曲线图 102 3.4.5 柱状图 105 3.4.6 条形图 109 3.4.7 饼图 111 3.4.8 面积堆积图 115 3.4.9 直方图和密度曲线图 118 3.5 绘图窗口操作函数 120 3.5.1 单一窗口中的子绘图 区域布局 120 3.5.2 绘图窗口操作 120 第4 章 单指标分析 121 4.1 指标描述 121 4.1.1 平均值和集中趋势 121 4.1.2 正态分布 126 VIII 4.1.3 频数分析 130 4.1.4 描述性分析指标 131 4.2 异常点监控 133 4.2.1 概述 133 4.2.2 P 控制图:监控转化率 型指标 135 4.2.3 单值 – 均值控制图 142 4.2.4 单值 – 移动极差控制图 147 4.3 连续型指标的对比 150 4.3.1 数据变换 150 4.3.2 假设检验 152 4.3.3 相同指标内的两组数 对比:T 检验 153 4.3.4 相同指标内的多组数据对比: 单因素方差分析 156 4.3.5 单因素协方差分析 163 4.4 分类型指标的对比 167 4.4.1 列联表分析 167 4.4.2 卡方独立性检验 172 第5 章 时间序列分析 177 5.1 时间序列 177 5.2 增长率 180 5.2.1 环比增长率 180 5.2.2 同比增长率 181 5.3 移动平均 181 5.3.1 数学原理概述 181 5.3.2 filter 函数 182 5.3.3 R 语言实现 184 5.4 指数平滑 185 5.4.1 一次指数平滑 186 5.4.2 二次指数平滑 187 5.4.3 三次指数平滑 191 5.5 ARIMA 模型 194 5.5.1 自相关性 194 5.5.2 平稳性和白噪声 199 5.5.3 MA 滑动平均过程 200 5.5.4 AR 自回归过程 202 5.5.5 ARMA 自回归滑动平均 混合过程 203 5.5.6 检验模型质量 205 5.5.7 非平稳时间序列的 ARIMA 过程 208 第6 章 连续指标建模:回归分析 213 6.1 一元线性回归分析 213 6.1.1 引例 213 6.1.2 一元线性回归分析的 原理及 R 语言实现 214 6.2 多元回归分析 221 6.2.1 引例 222 6.2.2 多元线性回归分析建模 222 6.2.3 模型修正函数 update() 223 6.2.4 逐步回归分析函数 step() 226 6.2.5 自变量中包含分类型 数据的回归分析 228 6.3 Logic 回归分析 230 6.3.1 引例及数据 230 6.3.2 logic 分析的原理 230 6.3.3 R 语言实现 232 6.4 回归树CART 237 6.4.1 rpart 函数 237 6.4.2 预测及模型性能衡量 240 6.4.3 过度拟合和剪枝 240 IX 第7 章 分类指标建模: 分类分析 243 7.1 决策树分类分析 243 7.1.1 概述 243 7.1.2 C4.5 算法 247 7.1.3 CART 算法 258 7.1.4 条件推理决策树算法 265 7.1.5 随机森林算法 267 7.2 贝叶斯分类 268 7.2.1 贝叶斯定理 268 7.2.2 朴素贝叶斯分类器 270 7.3 支持向量机SVM 271 7.3.1 原理 271 7.3.2 在 R 语言中实现非线性 SVM 分析 273 7.4 人工神经网络 274 7.4.1 神经元 274 7.4.2 两层网络 275 7.4.3 反向传播算法 276 7.4.4 R 语言实现 282 7.4.5 隐藏层中神经单元数 目的确定 283 7.5 分类器的性能评估 284 7.5.1 混淆矩阵 284 7.5.2 ROC 曲线和AUC 287 7.5.3 提升度和提升曲线 291 7.5.4 洛伦兹曲线 292 第8 章 样本细分 293 8.1 数据降维 293 8.1.1 问题引入 293 8.1.2 因子分析概述 294 8.1.3 factanal 函数 296 8.1.4 实例:问卷调查的因子 分析 297 8.2 聚类分析 303 8.2.1 距离 303 8.2.2 层次聚类 313 8.2.3 kmeans 聚类 318 8.3 样本判别 321 8.3.1 knn(k 最近邻分类) 算法 323 8.3.2 实例:基于 knn 算法的 商品推荐系统 324 第9 章 样本间的关系 329 9.1 关联分析 329 9.1.1 关联分析的原理 329 9.1.2 Apriori 算法的R 语言 实现 331 9.2 序列模式关联分析 334 9.2.1 序列模式关联分析的 原理 334 9.2.2 序列模式关联分析的 R 语言实现 336 9.2.3 实例:用户点击页面的 行为分析 338 9.3 关系网络分析 346 9.3.1 网络关系分析的基本 概念 346 9.3.2 中心度 356 9.3.3 中心势 362 9.3.4 社群发现 363 9.3.5 实例:分析微博的 传播特性 367 9.3.6 实例:购物车商品分类 分析 370
上传时间:2014-09 大小:3.69MB
- 1.29MB
python3.5.2安装包
2018-09-26python3.5.2安装包
- 79.3MB
R-3.5.1 64
2018-07-31R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
- 1KB
R语言安装包
2013-12-18R 语言安装包,自己写的程序包,在linux下可安装
- 1.15MB
《R语言数据分析与挖掘》教学课件—06绘图与数据可视化.pdf
2022-06-23《R语言数据分析与挖掘》教学课件—06绘图与数据可视化.pdf《R语言数据分析与挖掘》教学课件—06绘图与数据可视化.pdf《R语言数据分析与挖掘》教学课件—06绘图与数据可视化.pdf《R语言数据分析与挖掘》教学课件—06...
- 4.81MB
《R语言商务数据分析实战》教学课件—09 电商产品评论数据情感分析.pdf
2022-06-22《R语言商务数据分析实战》教学课件—09 电商产品评论数据情感分析.pdf《R语言商务数据分析实战》教学课件—09 电商产品评论数据情感分析.pdf《R语言商务数据分析实战》教学课件—09 电商产品评论数据情感分析.pdf...
- 107KB
R语言编程与数据统计分析实战.pdf
2022-05-08R语言编程与数据统计分析实战.pdfR语言编程与数据统计分析实战.pdfR语言编程与数据统计分析实战.pdfR语言编程与数据统计分析实战.pdfR语言编程与数据统计分析实战.pdf
- 43.73MB
R语言数据分析与挖掘实战_R语言_
2021-10-02r语言指导,用于自主学习r语言,各种分析方法和模型
- 3.29MB
R语言与统计分析-汤银才.pdf
2015-07-01R语言与统计分析-汤银才.pdf
- 751KB
R语言小波分析wavelet
2018-05-08R语言小波分析wavelet
- 42.99MB
空间数据分析与R语言实践
2015-11-20空间数据分析与R语言实践
- 2KB
xthreg2命令安装包
2022-04-09门槛回归 门限回归 stata 门槛面板 门槛回归(Threshold Regression)是一种非线性回归方法,它假设因变量在自变量上存在一个或多个阈值,当自变量超过或达到这个阈值时,因变量的变化发生了显著的跃迁。因此,门槛回归可以用来分析因变量对于自变量的非线性响应,特别是当因变量的响应在某个阈值点发生了显著变化时。 门限回归(Tobit Regression)是一种特殊的门槛回归方法,它被广泛用于处理截尾数据或半截尾数据。在门限回归中,因变量的值只有在一个阈值以上才能被观测到,而在这个阈值以下,因变量的值被截断或缺失。因此,门限回归通常用于分析存在截尾数据或半截尾数据的情况下,自变量对于因变量的影响。 Stata是一种常用的统计软件,可以进行门槛回归和门限回归分析。使用Stata进行门槛回归和门限回归分析需要使用特定的命令,如"threshold"和"censored"命令。 门槛面板(Threshold Panel)模型则是一种将门槛回归和面板数据模型相结合的方法。在门槛面板模型中,因变量的非线性响应在面板数据中是存在的,而这种响应是通过将截距项或斜率项或两者都设置为门
- 102KB
数据源-数据可视化(七):Pandas香港酒店数据高级分析,涉及相关系数,协方差,数据离散化,透视表等精美可视化展示
2024-04-23数据源——数据可视化(七):Pandas香港酒店数据高级分析,涉及相关系数,协方差,数据离散化,透视表等精美可视化展示
- 3.40MB
Python金融量化的高级库:TA-Lib-0.4.24(包含python3.7、3.8、3.9、3.10的32位和64位版本)
2023-08-02TA-Lib(Technical Analysis Library, 即技术分析库)是Python金融量化的高级库,涵盖了150多种股票、期货交易软件中常用的技术分析指标,如MACD、RSI、KDJ、动量指标、布林带等。但很多人安装指标计算ta-lib库就总报错,就可以在这里找到包下载后安装。 文件举例:TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 命名解释:包名-版本号-cp37代表适用于python3.7版本-win代表windows平台-amd64表示64位版本(与python版本要一致) 假定文件下载到d盘根目录,使用如下命令进行安装: pip install d:\TA_Lib‑0.4.24‑cp37‑cp37m‑win_amd64.whl 原文链接:https://blog.csdn.net/popboy29/article/details/126140862 建议使用360压缩进行解压。
- 1.35MB
2022泰迪杯数据分析技能赛B题代码 Jupyter Notebook
2022-12-142022泰迪杯数据分析技能赛B题一等奖 方案及赛后总结:https://blog.csdn.net/u014111377/article/details/127905972 欢迎学习交流 任务1:数据探索与清洗 任务2:产品营销数据可视化分析 任务3:客户流失因素可视化分析 任务4:特征构建 任务5:银行客户长期忠诚度预测建模
- 407.36MB
统计数模历年优秀论文-全国大学生统计建模大赛
2023-05-16为在大学生中倡导学习统计、应用统计的良好氛围,促进大学生关注经济社会热点难点问题,适应大数据时代下高校及统计部门对统计人才的培养要求,中国统计教育学会、全国应用统计专业学位研究生教育指导委员会联合举办2021年(第七届)全国大学生统计建模大赛,本届大赛主题为“数据新动能的统计测度研究”,旨在提高大学生数据挖掘、数据分析、运用统计方法及计算机技术处理数据的能力,加强创新思维意识,助力推进统计现代化改革。经过一年的筹备、征集和筛选评议工作,最终选出这26篇优秀论文集结成册,展示当代大学生的统计应用能力和研究水平。 欢迎扫描以上二维码订阅 扫一扫在手机打开 上一篇: 《2022年(第八届)... 下一篇: 关于公布2022年(第... 评论262 0/150 提交 热门评论 相关推荐 关于公布2023年(第九届)全国大学生统计建模大赛报名信息的通知 大赛动态 2023-04-10 10:00595451143 《2023年(第九届)全国大学生统计建模大赛主题解读》(视频) 大赛动态 2023-04-06 09:0046299990 “全国大学生统计建模大赛”成功入
- 1.7MB
2022年美赛(MCM)C题M奖论文
2022-05-082022年美赛(MCM)C题M奖论文,查看论文需要1.9元,不是很贵,欢迎支持我们。学术生涯不易,希望大家理解,嗷嗷待哺欢迎投喂!
- 244KB
Origin中【CorrelationPlot】插件
2023-06-25Origin中【CorrelationPlot】插件 下载后解压,直接拖动到Origin主界面右侧APP界面中即可使用,下载一次后,后面不需要再进行设置,每次打开直接使用即可。
- 8.16MB
实验3客户RFM实验案例代码
2024-04-22 一、实验目的 1掌握RFM分析方法和k-means聚类的方法,能够进行价值识别 2掌握Python 聚类的方法 3.EM聚类(基于高斯混合模型的EM聚类) 二、知识准备 RFM模型是衡量客户价值和客户创利能力的重要工具和手段。在客户分类中,RFM模型是一个经典的分类模型,利用通用交易环节中最核心的三个维度——最近消费(Recency)、消费频率(Frequency)、消费金额(Monetary)细分客户群体,从而分析不同群体的客户价值。 三、实验准备 1.使用算法:RFM模型、聚类算法 2. 数据来源 RFM数据集为英国在线零售商在2010年12月1日至2011年12月9日间发生的所有网络交易订单信息。该公司主要销售礼品为主,并且多数客户为批发商。 数据集介绍及来源: https://www.kaggle.com/carrie1/ecommerce-data https://archive.ics.uci.edu/ml/datasets/online+retail# 特征说明: InvoiceNo:订单编号,由六位数字组成,退货订单编号开头有字母C StockCode
- 5.45MB
中国自然保护区名录+矢量边界数据
2024-04-01该数据收集于中国自然保护区标本资源共享平台,包括自然保护区名录Excel表和矢量shp边界,包括保护级别、保护类型、建立年份、保护面积、所属部门、所在城市等详细保护区信息。可作为生物多样性、生态系统保护评估的基础数据源。
- 116KB
python数据分析大作业-爬虫、建立模型、可视化、结论分析
2023-06-09包括代码文件
- 10.63MB
计算方法-上机作业-示例【仅供交流参考】
2022-12-10目 录【仅供交流参考,严禁抄袭!!!】 1 利用共轭梯度法求解大规模稀疏方程组 1.1 算法原理 1.2 程序框图及使用说明 1.3 具体算例及计算结果 1.4 最速下降法原理及程序框图 1.5 结果分析与比较 2 最小二乘拟合问题的求解 2.1 算法原理 2.1.1线性最小二乘法 2.1.2最小二乘法拟合函数方法 2.2 最小二乘法程序框图及使用说明 2.3 具体算例及计算结果分析 3 利用迭代法求解非线性方程及方程组 3.1 求解非线性方程的迭代法 3.1.1 二分法 3.1.2 简单迭代法 3.1.3 牛顿法 3.1.4 弦割法 3.1.5具体算例及计算结果(包括程序说明) 3.2 求解非线性方程组的迭代法 3.2.1 牛顿法 3.2.2 弦割法 3.2.3 布洛依登法 3.2.4 具体算例及计算结果(包括程序说明) 4 工程领域实际问题的计算求解 4.1题目要求 4.2实际应用问题 4.3问题分析及解决方法 4.4算法原理 4.5计算结果及分析(包括程序使用说明) 附录1 共轭梯度法求解大规模稀疏方程组程序 附录2 三对角矩阵A、右端项b生成程序
- 6KB
天气数据爬取的源代码-可以运行
2023-08-06天气数据爬取的源代码-可以运行
- 1.11MB
GARCH-MIDAS、DDC-MIDAS模型MATLAB代码
2023-01-032,4版 可以估计DCC-MIDAS adl-MIDAS DCC-GARCH
- 1.70MB
利用citespace对知网和WOS文献做文献综述
2024-04-09利用citespace对知网和WOS文献做文献综述
- 414.60MB
零基础入门转录组分析-数据处理(TCGA数据库)教程配套的代码,原始数据以及最终处理好的数据
2024-03-29TCGA数据集是转录组分析常用的数据库,从数据库中获取相应的数据集之后进行数据清洗过程相对麻烦,但同时也是最关键的一步,本资源是零基础入门转录组分析——数据处理(TCGA数据库)教程中配套的代码+原始数据+最终处理好的数据。 零基础入门转录组分析——数据处理(TCGA数据库)教程链接:https://blog.csdn.net/weixin_49878699/article/details/135373467?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22135373467%22%2C%22source%22%3A%22weixin_49878699%22%7D
- 62KB
Attachment 实现 全文检索
2023-11-05Attachment 插件是 Elasticsearch 中的一种插件,允许将各种二进制文件(如PDF、Word文档等)以及它们的内容索引到 Elasticsearch 中。插件使用 Apache Tika 库来解析和提取二进制文件的内容。通过使用 Attachment 插件,可以轻松地在 Elasticsearch 中建立全文搜索功能,而无需事先转换二进制文件为文本。 优点: 可以将各种类型的二进制文件以原始形式存储在 Elasticsearch 中。这使得保存和访问二进制文件变得更加简单和高效。 插件使用 Apache Tika 库来解析和提取二进制文件的内容,因此可以提取并存储内容、元数据以及格式化的文本数据。这使得 Elasticsearch 可以轻松地对文档执行全文搜索以及文档内容的其他分析操作。 在 Elasticsearch 中使用 Attachment 插件,可以轻松地实现以下一些功能:搜索文档、生成全文搜索报告、自动标记文件、提取数据并进行分析,在文档中查找特定项等。
- 197KB
大乐透第一期至今全部期数的开奖结果(2007年-2023年5月共2423期)
2023-05-26我们使用大数据进行数据分析的时候,数据为基础中的基础。很多彩民进行杀号分析的时候,需要花费不少时间进行数据统计。这个csv版本统计汇总了历年的开奖结果,一目了然。方便进行号码分析。
- 24.46MB
zotero科研插件合集(zotero 6.0 适用)
2022-04-06包含zotero大部分科研插件。如:Jasminum-茉莉花(zotero中文插件,可获取知网引用量、拆分和合并作者姓名),学术引用插件zotero-scholar-citations,zotero-scihub插件(可自动获取论文PDF),zotfile(zotero文件管理插件),zotero-scite, pubpeer,paper_machines, cita......
- 1.19MB
besnew-超强二进制文件查看工具
2022-03-21右键属性 支持16进制,10进制,二进制,8进制查看。 可自定义列数,独特码查找、不定帧长查看。方便数据帧分析。 免安装。 使用时可能需要先使用管理员权限启动。 注意事项: 1,一定要解压出来再用。 2,默认需要先打开bes,然后再从左上角打开要查看分析的文件。 最好设置一下管理员权限执行: 选中bes.exe文件,右键属性-》兼容性-》选中以管理员身份运行。 然后就可以找到数据文件,右键选择打开方式为bes.exe即可。
- 5.56MB
全国流域片数据,包含一、二、三级流域划分
2022-04-07全国流域片数据,包含一、二、三级流域划分; 数据格式为shapefile(shp)格式,坐标系为WGS-84坐标系; 数据范围为全国流域; 一级流域包括长江流域、黄河流域等,二级流域包括渭河流域、泾河流域等,以及三级流域,数据真实可靠,可用于实验或者科研当中,也可用于绘制研究区概况图,可用arcgis、QGIS等软件打开进行实验或制图。