PRACTICAL LARGE SCALE EXPERIENCES WITH SPARK 2.1 MACHINE LEARNING

在SPARK SUMMIT 2017上,Berni Schiefer IBM, Spark Technology Center分享了题为《PRACTICAL LARGE SCALE EXPERIENCES WITH SPARK 2.1 MACHINE LEARNING》,就IBM如何利用SparkM...

Scalable Deep Learning on Spark

在Hadhoop summit 2016上,Matthias Langer和Dr.Zhen He,Prof. Wenny Rahayu分享了题为《Scalable Deep Learning on Spark》,就深度学习介绍和深度学习系统的研究等方面的内容做了深入的分析。 https://yq.a...

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第一阶段

33 课时 |
283 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第二阶段

28 课时 |
248 人已学 |
免费

大数据实战项目:反爬虫系统(Lua+Spark+Redis+Hadoop框架搭建)第三阶段

25 课时 |
92 人已学 |
免费
开发者课程背景图

An Online Spark Pipeline Semi Supervised Learning and Online Retraining with Spark Streaming

Presented: J.White Bear在Spark Summit 2017上做了主题为《An Online Spark Pipeline Semi Supervised Learning and Online Retraining with Spark Streaming》的演讲,就为什么我...

Apache Spark Mllib 2.x:How to Productionize Your Machine Learning Models

Richard Garris在Spark Summit 2017上做了主题为《Apache Spark Mllib 2.x:How to Productionize Your Machine Learning Models》的演讲,就什么是databricks,设计进程中遇到的挑战与设计亮点等进行了...

Spark大数据处理系列之Machine Learning

本文是《Spark大数据处理》系列的第四篇,其他三篇:Spark介绍、 Saprk SQL和 Spark Streaming 。 最近几年,机器学习、预测分析和数据科学主题得到了广泛的关注。Spark的机器学习库(Spark MLlib),包括各种机器学习算法:协同过滤...

《Machine Learning with Spark》书评与作者访谈

机器学习是基于现有数据,通过数据驱动做出决策或者预测的技术。Apache Spark及其机器学习库MLlib为开发可伸缩的机器学习应用,提供了多种有用的算法。InfoQ采访了《Machine Learning with Spark》一书的作者Nick Pentreath,共同探讨了有关数据科学和机器...

Machine Learning on Spark——第四节 统计基础(二)

作者:周志湖 微信号:zhouzhihubeyond 本节主要内容 Correlation 相关性分析 分层采样(Stratified sampling) 随机数据生成(Random data generation) 1. Correlation 相关性分析 相关性分析用于研究两个随机变量之间的依赖...

Machine Learning on Spark——第三节 统计基础(一)

作者:周志湖 微信号:zhouzhihubeyond 本文主要内容 本文对了org.apache.spark.mllib.stat包及子包中的相关统计类进行介绍,stat包中包括下图中的类或对象: 本文将对其中的部分内容进行详细讲解 获取矩阵列(column-wise)统计信息 Kernel den...

Machine Learning On Spark——第二节:基础数据结构(二)

作者:周志湖 微信号:zhouzhihubyond 本节主要内容 IndexedRowMatrix BlockMatrix 1. IndexedRowMatrix的使用 IndexedRowMatrix,顾名思义就是带索引的RowMatrix,它采用case class IndexedRow(ind...

Machine Learning On Spark——第一节:基础数据结构(一)

作者:周志湖 微信号:zhouzhihubyond 本节主要内容 本地向量和矩阵 带类标签的特征向量(Labeled point) 分布式矩阵 1. 本地向量和矩阵 本地向量(Local Vector)存储在单台机器上,索引采用0开始的整型表示,值采用Double类型的值表示。Spark MLlib...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

Apache Spark 中国技术社区
Apache Spark 中国技术社区
阿里巴巴开源大数据技术团队成立 Apache Spark 中国技术社区,定期推送精彩案例,问答区数个 Spark 技术同学每日在线答疑,只为营造 Spark 技术交流氛围,欢迎加入!
4459+人已加入
加入
相关电子书
更多
云HBaseSQL及分析 ——Phoenix&Spark
R AND SPARK
Scalable Deep Learning on Spark
立即下载 立即下载 立即下载