使用SQL和机器学习进行大规模自动化数据质量测试

使用SQL和机器学习进行大规模自动化数据质量测试

数据管道可能因一百万种不同的原因而中断,但是我们如何确保实时识别和处理这种“数据停机时间”呢?有时,只需要一些SQL,Jupyter Notebook和一些机器学习即可。随着公司依赖越来越多的数据来为日益复杂的管道提供动力,这些数据必须可靠,准确和可信赖。当数据中断时(无论是由于架构更改࿰...

【吴恩达机器学习笔记】十五、大规模机器学习

【吴恩达机器学习笔记】十五、大规模机器学习

十五、大规模机器学习1. 学习大数据在开始这一章内容之前,我们先回顾一下之前学的高偏差和高方差问题。如果目前处于高方差问题,即出现上面左图情况,那么增加训练集数量是可以有效减少误差的。但如果处于高偏差问题,即出现上面右图情况,那么增加训练集数量并不能很好减少误差,所以这时就要通过增加特征量等方法去改...

《机器学习在大规模服务器治理复杂场景的实践》电子版地址

《机器学习在大规模服务器治理复杂场景的实践》电子版地址

《机器学习在大规模服务器治理复杂场景的实践》机器学习在大规模服务器治理复杂场景的实践 电子版下载地址: https://developer.aliyun.com/ebook/5782 电子书:

《基于Spark的大规模机器学习在微博的应用》电子版地址

《基于Spark的大规模机器学习在微博的应用》电子版地址

《基于Spark的大规模机器学习在微博的应用》基于Spark的大规模机器学习在微博的应用 电子版下载地址: https://developer.aliyun.com/ebook/2559 电子书:

《基于Apache Spark 的大规模分布式机器学习实践》电子版地址

《基于Apache Spark 的大规模分布式机器学习实践》电子版地址

《基于Apache* Spark* 的大规模分布式机器学习实践》基于Apache* Spark* 的大规模分布式机器学习实践 电子版下载地址: https://developer.aliyun.com/ebook/5244 电子书: </div>

十七、大规模机器学习和随机梯度下降(SGD)

十七、大规模机器学习和随机梯度下降(SGD)

1、随机梯度下降-Stochastic Gradient Descent 随机梯度下降是相对于批量梯度下降(batch gradient descent)提出的,目的在训练集数据非常大时,加快求解梯度的速度。不同于梯度下降中,每次计算梯度的时候需要计算所有训练数据的梯度,SGD每次只计算一...

《大规模机器学习在蚂蚁+阿里的应用》电子版地址

《大规模机器学习在蚂蚁+阿里的应用》电子版地址

《大规模机器学习在蚂蚁+阿里的应用》大规模机器学习在蚂蚁+阿里的应用 电子版下载地址: https://developer.aliyun.com/ebook/4725 电子书: </div>

《大规模机器学习在蚂蚁+阿里的应用》电子版地址

《大规模机器学习在蚂蚁+阿里的应用》电子版地址

《大规模机器学习在蚂蚁+阿里的应用》大规模机器学习在蚂蚁+阿里的应用 电子版下载地址: https://developer.aliyun.com/ebook/1105 电子书: </div>

图解来啦!机器学习工业部署最佳实践!10分钟上手机器学习部署与大规模扩展 ⛵

图解来啦!机器学习工业部署最佳实践!10分钟上手机器学习部署与大规模扩展 ⛵

作者:韩信子@ShowMeAI 机器学习实战系列:https://www.showmeai.tech/tutorials/41 深度学习实战系列:https://www.showmeai.tech/tutorials/42 本文地址:https://www.showmeai.tech/article...

15 年老兵谈阿里云大规模机器学习实践

  近年来,机器学习技术的发展归因于我们有极其庞大的数据用来训练算法。当企业需要落地大规模机器学习时,往往会面临很多难题,如何解决这些问题?如何系统了解大规模机器学习落地的技巧?其适用场景是什么?InfoQ 希望通过该选题解决这些问题,并推动企业在大规模机器学习方面的实践。本文,InfoQ 有幸采访...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

阿里云机器学习平台PAI
阿里云机器学习平台PAI
阿里云机器学习PAI(Platform of Artificial Intelligence)面向企业及开发者,提供轻量化、高性价比的云原生机器学习平台,涵盖PAI-iTAG智能标注平台、PAI-Designer(原Studio)可视化建模平台、PAI-DSW云原生交互式建模平台、PAI-DLC云原生AI基础平台、PAI-EAS云原生弹性推理服务平台,支持千亿特征、万亿样本规模加速训练,百余落地场景,全面提升工程效率。
2435+人已加入
加入
相关电子书
更多
大规模机器学习在蚂蚁+阿里的应用
基于Spark的面向十亿级别特征的 大规模机器学习
基于Spark的大规模机器学习在微博的应用
立即下载 立即下载 立即下载

机器学习平台 PAI大规模相关内容