大数据与机器学习:实践方法与行业案例.3.1 数据缓冲区的基本规则

第3章 实战:打造数据闭环 道生一,一生二,二生三,三生万物。万物负阴而抱阳,冲气以为和。 —老子《道德经》 你不能两次踏进同一条河流,因为新的水不断地流过你的身旁。 —柏拉图《泰阿泰德》 前面两章已经介绍了数据闭环的各个主要环节和涉及的技术,本章将基于前文提出的理念和技术来实现数据闭环。按照数据的...

大数据与机器学习:实践方法与行业案例.2.2 数据缓冲区

2.2 数据缓冲区 数据缓冲区是处于生产环境和分析环境之间的中间区域,它是数据闭环中各个系统间的数据中转站,从各个系统接收原始数据,并将其暂存在对应的目录中。其他系统可以从数据缓冲区中获取需要的数据文件。 为了便于管理和迁移数据,我们规定存入数据缓冲区中的数据使用文本文件的格式,这样一来,数据缓冲区...

大数据与机器学习:实践方法与行业案例.2.1 数据闭环

第2章 数 据 体 系 迟序之数,非出神怪,有形可检,有数可推。事类相推,各有攸归,故枝条虽分而同本干知,发其一端而已。又所析理以辞,解体用图,庶亦约而能周,通而不黩,览之者思过半矣。 —刘徽《九章算术注》 管理就是决策。 —赫伯特·西蒙 数据存在于生产环境、数据缓冲区以及分析环境的各个节点中,并且...

大数据与机器学习:实践方法与行业案例.1.1 数据的基本形态

数据与平台篇 (Data & Infrastructures) 迟序之数,非出神怪,有形可检,有数可推。 —祖冲之 数学是知识的工具,亦是其他知识工具的泉源。所有研究顺序和度量的科学均和数学有关。 —笛卡儿   对于大部分非计算机专业出身的分析人员和业务人员来说,数据库领域的专业术...

大数据与机器学习:实践方法与行业案例1.1 数据的基本形态

迟序之数,非出神怪,有形可检,有数可推。 —祖冲之 数学是知识的工具,亦是其他知识工具的泉源。所有研究顺序和度量的科学均和数学有关。 —笛卡儿   对于大部分非计算机专业出身的分析人员和业务人员来说,数据库领域的专业术语简直让人抓狂,非要搞得那么高深吗?大可不必。 数据科学家是数据的应用者...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

相关电子书
更多
大规模机器学习在蚂蚁+阿里的应用
基于Spark的面向十亿级别特征的 大规模机器学习
基于Spark的大规模机器学习在微博的应用
立即下载 立即下载 立即下载