【大数据开发运维解决方案】ogg(GoldenGate)三大进程常用参数

【大数据开发运维解决方案】ogg(GoldenGate)三大进程常用参数

============================================1、管理进程oggCI (ogg1) 22> edit params mgrPORT 7809DYNAMICPORTLIST 7810-7860AUTORESTART ER *, RETRIES 3, WA...

【大数据开发运维解决方案】GoldenGate replicat进程延迟分析步骤

【大数据开发运维解决方案】GoldenGate replicat进程延迟分析步骤

@TOC前言GoldenGate几乎支持市面上流行的所有主流的操作系统平台和数据库。博主所在单位目前使用Oracle GoldenGate将各个业务生产库汇聚到一起做数仓实时ODS平台, 我们采用异构同步,即源端同步过来的表在ODS新增了一个etltime字段,用来记录当前数据变更时间。 为了记录数...

存储的降本增效与运维

14 课时 |
14 人已学 |
免费

企业运维训练营之云上监控运维最佳实践课程

4 课时 |
1315 人已学 |
免费

企业运维训练营之大数据EMR原理与实践

8 课时 |
2696 人已学 |
免费
开发者课程背景图
【大数据开发运维解决方案】hadoop+kylin安装及官方cube/steam cube案例文档

【大数据开发运维解决方案】hadoop+kylin安装及官方cube/steam cube案例文档

对于hadoop+kylin的安装过程在上一篇文章已经详细的写了,请读者先看完上一篇文章再看本本篇文章,本文主要大致介绍kylin官官方提供的常规批量cube创建和kafka+kylin流式构建cube(steam cube)的操作过程,具体详细过程请看官方文档。1、常规cube创建案例[root@...

【大数据开发运维解决方案】Kylin消费Kafka数据流式构建cube

【大数据开发运维解决方案】Kylin消费Kafka数据流式构建cube

文章开始之前先说明环境情况,这里kylin消费的kafka数据是从Oracle 数据库用Ogg For Bigdata以json格式将数据投递到kafka topic的,投递的时候,关于insert和update 之前的数据投递到名为 ZTVOUCHER_INS 的topic,而delete和upd...

【大数据开发运维解决方案】Hadoop2.7.6+Spark单机伪分布式安装

【大数据开发运维解决方案】Hadoop2.7.6+Spark单机伪分布式安装

一、安装spark依赖的Scala1.1 下载和解压缩Scala下载地址:点此下载或则直接去官网挑选下载:官网连接在Linux服务器的opt目录下新建一个名为scala的文件夹,并将下载的压缩包上载上去:[root@hadoop opt]# cd /usr/ [root@hadoop usr]# m...

【大数据开发运维解决方案】Hadoop2.7.6+Spark2.4.4+Scala2.11.12+Hudi0.5.2单机伪分布式安装

【大数据开发运维解决方案】Hadoop2.7.6+Spark2.4.4+Scala2.11.12+Hudi0.5.2单机伪分布式安装

Hadoop2.7.6+Spark2.4.4+Scala2.11.12+Hudi0.5.2单机伪分布式安装注意1、本文档使用的基础hadoop环境是基于本人写的另一篇文章的基础上新增的spark和hudi的安装部署文档,基础环境部署文档2、整篇文章配置相对简单,走了一些坑,没有写在文档里,为了像我一...

【大数据开发运维解决方案】Sqoop增量同步mysql/oracle数据到hive(merge-key/append)测试文档

【大数据开发运维解决方案】Sqoop增量同步mysql/oracle数据到hive(merge-key/append)测试文档

上一篇文章介绍了sqoop全量同步数据到hive,本片文章将通过实验详细介绍如何增量同步数据到hive,以及sqoop job与crontab定时结合无密码登录的增量同步实现方法。一、知识储备在生产环境中,系统可能会定期从与业务相关的关系型数据库向Hadoop导入数据,导入数仓后进行后续离线分析。故...

【大数据开发运维解决方案】Sqoop全量同步mysql/Oracle数据到hive

【大数据开发运维解决方案】Sqoop全量同步mysql/Oracle数据到hive

前面文章写了如何部署一套伪分布式的handoop+hive+hbase+kylin环境,也介绍了如何在这个搭建好的伪分布式环境安装配置sqoop工具以及安装完成功后简单的使用过程中出现的错误及解决办法,接下来本篇文章详细介绍一下使用sqoop全量同步oracle/mysql数据到hive,这里实验采...

【大数据开发运维解决方案】sqoop避免输入密码自动增量job脚本介绍

【大数据开发运维解决方案】sqoop避免输入密码自动增量job脚本介绍

上一篇文章介绍了sqoop增量同步数据到hive,同时上一篇文章也给出了本人写的hadoop+hive+hbase+sqoop+kylin的伪分布式安装方法及使用和增量同步实现的连接,本篇文章将介绍如何将上一篇文章介绍的增量方式同sqoop自带的job机制和shell脚本以及crontab结合起来实...

【大数据开发运维解决方案】sqoop增量导入oracle/mysql数据到hive时时间字段为null处理

【大数据开发运维解决方案】sqoop增量导入oracle/mysql数据到hive时时间字段为null处理

前面几篇文章详细介绍了sqoop全量增量导入数据到hive,大家可以看到我导入的数据如果有时间字段的话我都是在hive指定成了string类型,虽然这样可以处理掉时间字段在hive为空的问题,但是在kylin创建增量cube时需要指定一个时间字段来做增量,所以上面那种方式不行,这里的处理方式为把st...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
2023龙蜥操作系统大会全面推进运维智能化分论坛
CloudOps云上运维系列课程 | 演讲材料
通过 ACK 智能化运维体系获得集群自动化诊断和自愈能力
立即下载 立即下载 立即下载