基于Spark的机器学习实践 (十) - 降维

通过讲解PCA算法的原理,使大家明白降维算法的大致原理,以及能够实现怎么样的功能。结合应用降维算法在分类算法使用之前进行预处理的实践,帮助大家体会算法的作用。0 相关源码1 PCA算法及原理概述1.1 何为降维?◆ 从高维度变为低维度的过程就是降维◆ 例如拍照就是把处在三维空间中的人或物从转换到作为...

基于Spark的机器学习实践 (九) - 聚类算法

0 相关源码1 k-平均算法(k-means clustering)概述1.1 回顾无监督学习◆ 分类、回归都属于监督学习◆ 无监督学习是不需要用户去指定标签的◆ 而我们看到的分类、回归算法都需要用户输入的训练数据集中给定一个个明确的y值1.2 k-平均算法与无监督学习◆ k-平均算法是无监督学习的...

基于Spark的机器学习实践 (四) - 数据可视化

基于Spark的机器学习实践 (四) - 数据可视化

0 相关源码1 数据可视化的作用及常用方法1.1 为什么要数据可视化1.1.1 何为数据可视化?◆ 将数据以图形图像的形式展现出来◆ 人类可以对三维及以下的数据产生直观的感受1.1.2 数据可视化的好处◆ 便于人们发现与理解数据蕴含的信息◆ 便于人们进行讨论1.2 数据可视化的常用方法◆ 对于web...

基于Spark的机器学习实践 (二) - 初识MLlib(下)

基于Spark的机器学习实践 (二) - 初识MLlib(下)

2 MLlib的数据结构2.1 本地向量(Local vector)具有整数类型和基于0的索引和双类型值本地向量的基类是Vector,我们提供了两个实现:DenseVector 和 SparseVector◆ 本地向量是存储在本地节点上的,其基本数据类型是Vector.其有两个子集,分别是密集的与稀...

基于Spark的机器学习实践 (二) - 初识MLlib(上)

基于Spark的机器学习实践 (二) - 初识MLlib(上)

1 MLlib概述1.1 MLlib 介绍◆ 是基于Spark core的机器学习库,具有Spark的优点◆ 底层计算经过优化,比常规编码效率往往要高◆ 实现了多种机器学习算法,可以进行模型训练及预测1.2 Spark MLlib实现的算法◆ 逻辑回归 朴素贝叶斯 线性回归 SVM 决策树 LDA ...

基于 Spark 和 TensorFlow 的机器学习实践

基于 Spark 和 TensorFlow 的机器学习实践

本场视频链接:https://developer.aliyun.com/live/1547?spm=a2c6h.12873581.0.0.71671566iIzpz5&groupCode=apachespark 本场PPT资料:https://www.slidestalk.com/AliSp...

基于Spark的机器学习实践 (十) - 降维

通过讲解PCA算法的原理,使大家明白降维算法的大致原理,以及能够实现怎么样的功能。结合应用降维算法在分类算法使用之前进行预处理的实践,帮助大家体会算法的作用。 0 相关源码 1 PCA算法及原理概述 1.1 何为降维? ◆ 从高维度变为低维度的过程就是降维 ◆ 例如拍照就是把处在三维空间中的人或物从...

基于Spark的机器学习实践 (二) - 初识MLlib

1 MLlib概述 1.1 MLlib 介绍 ◆ 是基于Spark core的机器学习库,具有Spark的优点 ◆ 底层计算经过优化,比常规编码效率往往要高 ◆ 实现了多种机器学习算法,可以进行模型训练及预测 1.2 Spark MLlib实现的算法 ◆ 逻辑回归 朴素贝叶斯 线性回归 SVM 决策...

"基于 Apache* Spark* 的大规模 分布式机器学习实践"

"作为年度科技盛会,以“飞天•进化 Apsara Evolution”为主题的2016年云栖大会在杭州云栖小镇隆重召开。全球数万多名IT从业人员奔赴现场,共同描绘云计算发展趋势和蓝图,展现云计算、大数据、人工智能蓬勃发展的生态全景。 在云栖大会期间,Zhichao Li,Senior Softwar...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

阿里云机器学习平台PAI
阿里云机器学习平台PAI
阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。
2435+人已加入
加入
相关电子书
更多
大规模机器学习在蚂蚁+阿里的应用
基于Spark的面向十亿级别特征的 大规模机器学习
基于Spark的大规模机器学习在微博的应用
立即下载 立即下载 立即下载