场景描述 客户基于ECS、IDC自建或在友商云平台自建了大数 据集群,为了降低企业大数据计算平台的成本,提高 大数据应用开发效率,更有效保障数据安全,把大数 据集群的数据、作业、调度任务以及业务数据库整体 迁移到MaxCompute和其他云产品。 解决的问题 自建Hadoop集群搬迁到MaxCompute 自建Hbase集群搬迁到云Hbase 自建Kafka或应用数据准实时同步到 MaxCompute 自建Azkaban任务迁移到Dataworks任务 产品列表 MaxCompute,Dataworks、云数据库Hbase版、Datahub、VPC,ECS。
设置抽取数据的规则为:抽取定时任务执行时前一个小时分区的数据。例如,该任务在 2020年 2月 24日 18点 10分运行,那么将抽取 ds=20200224/hh=17/mm=00,并加载到目标表 odps_apache_logs的 ds=20200224分区中。源表分区取值:文档版本:20210723 52 自建Hadoop迁移MaxCompute Azkaban定时任务迁移和改造 ◼ ds=${date_of_...