R语言进行数据结构化转换:Box-Cox变换、“凸规则”变换方法

R语言进行数据结构化转换:Box-Cox变换、“凸规则”变换方法

线性回归时若数据不服从正态分布,会给线性回归的最小二乘估计系数的结果带来误差,所以需要对数据进行结构化转换。 在讨论回归模型中的变换时,我们通常会简单地使用Box-Cox变换,或局部回归和非参数估计。 这里的要点是,在标准线性回归模型中,我们有 ...

R语言非参数方法:使用核回归平滑估计和K-NN(K近邻算法)分类预测心脏病数据

R语言非参数方法:使用核回归平滑估计和K-NN(K近邻算法)分类预测心脏病数据

本文考虑一下基于核方法进行分类预测。注意,在这里,我们不使用标准逻辑回归,它是参数模型。 非参数方法 用于函数估计的非参数方法大致上有三种:核方法、局部多项式方法、样条方法。 非参的函数估计的优点在于稳健,对模型没有什么特定的假设,只是认为函数光滑,避免了模型选择带来的风险;但是,表达式复杂,难以解...

大数据之R语言速成与实战

30 课时 |
18022 人已学 |
免费
开发者课程背景图
R语言基于Bootstrap的线性回归预测置信区间估计方法

R语言基于Bootstrap的线性回归预测置信区间估计方法

我们知道参数的置信区间的计算,这些都服从一定的分布(t分布、正态分布),因此在标准误前乘以相应的t分值或Z分值。但如果我们找不到合适的分布时,就无法计算置信区间了吗?幸运的是,有一种方法几乎可以用于计算各种参数的置信区间,这就是Bootstrap 法。 本文使用BOOTSTRAP来获得预测的置信区间...

R语言基于树的方法:决策树,随机森林,Bagging,增强树

R语言基于树的方法:决策树,随机森林,Bagging,增强树

概观 本文是有关  基于树的  回归和分类方法的。 树方法简单易懂,但对于解释却非常有用,但就预测准确性而言,它们通常无法与最佳监督学习方法竞争。因此,我们还介绍了Bagging(自助法),随机森林和增强树。这些示例中的每一个都涉及产生多个树,然后将其合并以产生单个共识预测。我们...

R语言人口期望寿命统计预测方法

R语言人口期望寿命统计预测方法

本文对人口统计预测方法进行讨论。首先,我们将看到基本的静态方法。在使用数据集之前,我们使用“标准” 生命表。 download.file(url,"mortal") tables=readHTMLTable("morta ...

R语言k-Shape时间序列聚类方法对股票价格时间序列聚类

R语言k-Shape时间序列聚类方法对股票价格时间序列聚类

这次,我们将使用k-Shape时间序列聚类方法检查公司的股票收益率的时间序列。   企业对企业交易和股票价格 在本研究中,我们将研究具有交易关系的公司的价格变化率的时间序列的相似性,而不是网络结构的分析。由于特定客户的销售额与供应商公司的销售额之比较大,当客户公司的股票价格发生变化时,对供...

R语言异常值检测方法比较

R语言异常值检测方法比较

识别异常值的方法有很多种,R中有很多不同的方法。 关于异常值方法的文章使用了理论和实践的混合体。理论一切都很好,但异常值是异常值,因为它们不遵循理论。实践涉及数据的测试方法,有时用基于理论模拟的数据,更好地使用“真实”数据集。如果一种方法发现我们都同意的异常值,那么它可以被认为是成功的,但是我们是否...

R语言中不同类型的聚类方法比较

R语言中不同类型的聚类方法比较

聚类方法用于识别从营销,生物医学和地理空间等领域收集的多变量数据集中的相似对象。它们是不同类型的聚类方法,包括: 划分方法 分层聚类 模糊聚类 基于密度的聚类 基于模型的聚类 数据准备 演示数据集:名为USArrest的内置R数据集 删除丢失的数据 ...

R语言确定聚类的最佳簇数:3种聚类优化方法

R语言确定聚类的最佳簇数:3种聚类优化方法

确定数据集中最佳的簇数是分区聚类(例如k均值聚类)中的一个基本问题,它要求用户指定要生成的簇数k。 一个简单且流行的解决方案包括检查使用分层聚类生成的树状图,以查看其是否暗示特定数量的聚类。不幸的是,这种方法也是主观的。 我们将介绍用于确定k均值,k medoids(PAM)和层次聚类的最佳聚类数的...

R语言Ternary包绘制三元图、RGB三色空间分布图的方法

R语言Ternary包绘制三元图、RGB三色空间分布图的方法

  本文介绍基于R语言中的Ternary包,绘制三元图(Ternary Plot)的详细方法;其中,我们就以RGB三色分布图为例来具体介绍。  三元图可以从三个不同的角度反应数据的特征,因此在很多领域都得以广泛应用;如下图所示,就是一个最简单的三元图。其中,基于R语言中的Ternary包,我们可以非...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。