《数据科学:R语言实现》——3.12 估计缺失数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.12节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.12 估计缺失数据 之前的教程介绍了如何检测数据集中的缺失数值。尽管包含缺失值的数据并不完整,但是我们还是要采用启发式的方法来...

《数据科学:R语言实现》——3.11 检测缺失数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.11节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.11 检测缺失数据 缺失数据背后有许多原因。例如,可能是由于录入或者数据处理过程中的瑕疵导致的。然而,如果数据分析过程使用了缺...

大数据之R语言速成与实战

30 课时 |
18022 人已学 |
免费
开发者课程背景图

《数据科学:R语言实现》——3.10 重塑数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.10节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.10 重塑数据 重塑数据类似于创建列联表,它允许用户聚合特定值下的数据。reshape2程序包就是用来完成这个任务的。这里,我...

《数据科学:R语言实现》——3.9 排列数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.9节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.9 排列数据 排列可以让我们在某种顺序下观察数据,以便更有效地分析数据。在数据库中,我们可以使用order by语句对指定的列进...

《数据科学:R语言实现》——3.8 合并数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.8节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.8 合并数据 数据合并让我们理解不同数据源是如何相互关联的。R中的merge操作与数据库中的join操作类似,它使用两个数据集中...

《数据科学:R语言实现》——3.7 舍弃数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.7节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.7 舍弃数据 在之前的教程中,我们介绍了如何修改和过滤数据集。这些步骤基本上涵盖了数据预处理和数据准备的主要过程。但是,我们还想...

《数据科学:R语言实现》——3.6 过滤数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第3章,第3.6节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.6 过滤数据 数据过滤对于希望分析部分数据而不是全部数据集的读者来说是最常见的需求。在数据库操作中,我们可以使用带有where语...

《数据科学:R语言实现》——2.8 获取Facebook数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第2章,第2.8节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.8 获取Facebook数据 社交网络数据对于发掘和分析社会交互的用户来说,是另一个很好的数据源。社交网络数据与网站数据的主要不...

《数据科学:R语言实现》——2.2 下载公开数据

本节书摘来自华章计算机《数据科学:R语言实现》一书中的第2章,第2.2节,作者 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 2.2 下载公开数据 在进行数据分析之前,一项基础工作是收集高质量的有意义的数据。一个重要的数据来源是公开数据集。它们通常经过挑选和...

《数据科学:R语言实现》——3.12 估计缺失数据

本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第3章,第3.12节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。 3.12 估计缺失数据 之前的教程介绍了如何检测数据集中的缺失数值。尽管...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。