数据上云场景

MaxCompute平台提供了丰富的数据上传下载工具,可以广泛应用于各种数据上云的应用场景,本文为您介绍三种经典数据上云场景。Hadoop数据迁移 您可使用MMA...具体场景示例请参见 Flume收集网站日志数据到MaxCompute 和 海量日志数据分析与应用。

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

数据安全治理的必要性

当下企业在开展数据处理相关业务时,只要存在数据收集、处理、使用等行为,就需要从以下方面保障企业的经营合法合规。重点关注及遵守相关法律法规,时刻监督自己是否存在违规行为。例如,网络安全法、数据安全法、个性信息保护法、民法典及...

DataWorks数据服务对接DataV最佳实践

当今社会数据收集的方式不断丰富,行业数据大量积累,导致数据规模已增长到传统软件行业无法承载的海量级别。MaxCompute服务于批量结构化数据的存储和计算,已经连续多年稳定支撑阿里巴巴全部的离线分析业务。过去,如果您想要通过DataV...

确定需求

完成业务调研后,您需要进一步收集数据使用者的需求,进而对需求进行深度的思考和分析。需求分析的途径有两种:根据与分析师和业务运营人员的沟通获知需求。对报表系统中现有的报表进行研究分析。在需求分析阶段,您需要沉淀出业务分析或...

确定需求

完成业务调研后,您需要进一步收集数据使用者的需求,进而对需求进行深度的思考和分析。需求分析的途径有两种:根据与分析师和业务运营人员的沟通获知需求。对报表系统中现有的报表进行研究分析。在需求分析阶段,您需要沉淀出业务分析或...

概述

Apache Flume是一个分布式、可靠和高可用的系统,可以从大量不同的数据源有效地收集、聚合和移动日志数据,从而集中式的存储数据。使用场景 Flume使用最多的场景是日志收集,也可以通过定制Source来传输其他不同类型的数据。Flume最终会将...

需求分析

ods_raw_log_d 网站访问日志明细表数:dwd_log_info_di 用户网站访问信息宽表:dws_user_info_all_di 用户画像数据:ads_user_info_1d 根据规范设计数据流:本实验使用数据集成离线同步任务将用户信息数据与用户网站访问记录数据分别同步至...

需求分析

ods_raw_log_d 网站访问日志明细表:dwd_log_info_di 用户网站访问信息宽表:dws_user_info_all_di 用户画像数据:ads_user_info_1d 根据规范设计数据流:本实验使用数据集成离线同步任务将用户信息数据与用户网站访问记录数据分别同步至...

应用采集

收集运行期应用请求数据库的基本信息,比如请求的sql-schema-调用栈、应用系统信息、性能信息、SQL热度等。数据集中收集Collector。集中收集各应用Agent传输过来的数据,并进行脱敏、加工。应用采集可以完成:采集应用访问的SQL与调用栈...

实时同步能力说明

DataWorks为您提供的实时数据同步功能,方便您使用单表或整库同步方式,将源端数据库中部分或全部表的数据变化实时同步至目标数据库中,实现目标库实时保持和源库的数据对应。使用限制 实时同步不支持在数据开发界面运行任务,您需要保存、...

Global AWR用户指南

自动负载信息库AWR(Automatic Workload Repository)是数据收集和分析性能数据的工具。通过AWR工具,可以从数据库的动态视图等统计信息中生成某个时间段的性能报告。概述 PolarDB PostgreSQL版 的Global AWR性能报告功能,在提供数据库...

Global AWR用户指南

自动负载信息库AWR(Automatic Workload Repository)是数据收集和分析性能数据的工具。通过AWR工具,可以从数据库的动态视图等统计信息中生成某个时间段的性能报告。概述 PolarDB PostgreSQL版(兼容Oracle)的Global AWR性能报告功能,...

Global AWR用户指南

自动负载信息库AWR(Automatic Workload Repository)是数据收集和分析性能数据的工具。通过AWR工具,可以从数据库的动态视图等统计信息中生成某个时间段的性能报告。概述 PolarDB PostgreSQL版(兼容Oracle)的Global AWR性能报告功能,...

合规&认证

个人信息 甲乙双方均应严格遵守网络安全与数据保护相关法律法规的要求,其中,用户使用瓴羊服务收集、储存、处理、使用的个人信息和实施与这些数据有关的活动,须遵循合法、正当、必要原则,且应当遵守相关法律法规、瓴羊产品服务协议和瓴...

管理数据库资产

添加数据库后,您需要进行以下操作:您必须在已添加的数据库服务器上部署数据库审计的Agent程序,才能使数据库审计服务收集目标数据库的访问流量信息。具体操作,请参见 安装Agent。您可以为已添加的数据库配置审计规则,使命中规则的审计...

A100使用指南

步骤5:部署Agent程序 在数据库审计系统中添加数据库实例后,您必须在数据库服务器上部署Agent程序,才能使数据库审计服务收集目标数据库的访问流量信息,并进行审计。步骤6:查看系统审计结果 完成数据库接入和Agent部署后,您可以在数据...

迁移 OceanBase 数据库 MySQL 租户的数据至 MySQL ...

本文为您介绍如何使用数据传输迁移 OceanBase 数据库 MySQL 租户的数据至 MySQL 数据库。重要 如果数据迁移项目长期处于非活跃状态(项目状态为 失败、已暂停 或 已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动...

迁移 OceanBase 数据库 Oracle 租户的数据至 Oracle ...

背景信息 在数据传输控制台创建从 OceanBase 数据库 Oracle 租户迁移数据至 Oracle 数据库的数据迁移项目,您可以通过结构迁移、全量迁移和增量同步,无缝迁移源端数据库中的存量业务数据和增量数据至 Oracle 数据库。同时,数据传输支持将...

基本概念

同步初始化 同步初始化是指在开始执行增量数据同步前,DTS先开始收集增量数据,然后将待同步对象的结构和存量数据同步到目标库。同步初始化包括增量数据采集、结构初始化和全量数据初始化。增量数据采集:采集源库中待同步对象所有变更的...

产品架构

数据同步包括以下两个阶段:同步初始化:DTS先开始收集增量数据,然后将源数据库的结构和存量数据加载到目标数据库。数据实时同步:DTS同步正在进行的数据变更,并保持源数据库和目标数据库的同步。为了同步正在进行的数据变更,DTS使用两...

管理数据库资产

添加数据库后,您必须在数据库服务器上部署数据库审计的Agent程序,数据库审计服务才能收集目标数据库的访问流量信息。具体操作,请参见 安装Agent。同时,您还可以为数据库配置审计规则,使命中规则的审计记录触发告警。具体操作,请参见 ...

迁移 TiDB 数据库的数据至 OceanBase 数据库 MySQL ...

本文为您介绍如何使用数据传输迁移 TiDB 数据库的数据至 OceanBase 数据库 MySQL 租户。重要 如果数据迁移项目长期处于非活跃状态(项目状态为 失败、已暂停 或 已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动释放...

采集数据

本文为您介绍如何新建OSS和RDS数据源来访问本教程所提供的用户信息与网站日志数据,配置数据同步链路至私有OSS数据源,并通过EMR Hive节点建表去查询同步后的数据,完成数据同步的操作过程。前提条件 开始本文的操作前,请准备好需要使用的...

迁移 MySQL 数据库的数据至 OceanBase 数据库 MySQL ...

本文为您介绍如何使用数据传输迁移 MySQL 数据库的数据至 OceanBase 数据库 MySQL 租户。重要 如果数据迁移项目长期处于非活跃状态(项目状态为 失败、已暂停 或 已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动...

DataWorks On CDP/CDH使用说明

CDP是跨平台收集和整合客户数据的公共数据平台,可帮助您收集实时数据,并将其构建为单独的用户数据使用。您可在DataWorks中注册CDH及CDP集群,基于业务需求进行相关任务开发、调度、数据地图(元数据管理)和数据质量等一系列的数据开发和...

使用数据传输迁移数据

您可以通过数据迁移功能实时迁移其他数据源的数据至 OceanBase 数据库,以及迁移 OceanBase 数据库的数据至其他数据源。本文以迁移 MySQL 数据库的数据至 OceanBase 数据库为例,介绍如何使用数据传输迁移数据。前提条件 在迁移数据之前,...

迁移 Oracle 数据库的数据至 OceanBase 数据库 Oracle...

本文为您介绍如何使用数据传输迁移 Oracle 数据库的数据至 OceanBase 数据库 Oracle 租户。重要 如果数据迁移项目长期处于非活跃状态(项目状态为 失败、已暂停 或 已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动...

统计信息收集

统计信息收集方式 AnalyticDB PostgreSQL版 数据库内核参数gp_autostats_mode的值决定了数据库应该以什么方式去收集统计信息:none:禁止自动收集统计信息,所有统计信息的收集需要手动执行命令去收集。on_no_stats:当CREATE TABLE AS ...

数据上云工具

Flume(DataHub通道系列)Apache Flume是一个分布式的、可靠的、可用的系统,可高效地从不同的数据源中收集、聚合和移动海量日志数据到集中式数据存储系统,支持多种Source和Sink插件。Apache Flume的DataHub Sink插件可以将日志数据实时...

云数据库 RDS MySQL 版收集表的统计信息

概述 本文介绍云数据库 RDS MySQL 版如何收集表的统计信息。详细信息 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、RDS)等进行配置与数据修改...

ADAM概览

异构数据库迁移ADAM(Advanced Database&Application Migration)提供数据库平滑迁云解决方案,全面评估上云可行性、成本和云存储选型,内置实施协助、数据迁移、应用迁移等工具,覆盖数据库迁移的全生命周期,帮助企业降低数据库和应用...

统计信息

手动收集统计信息 收集全表统计信息 ANALYZE TABLE 命令会扫描全表来收集统计信息,对于数据量大的表,全表收集统计信息需消耗更多的时间,建议在业务低峰期执行或采样收集统计信息。语法 ANALYZE TABLE[schema_name.]table_name[UPDATE...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

OceanBase 数据库之间的数据迁移

背景信息 您可以在数据传输控制台创建从 OceanBase 数据库迁移数据至 OceanBase 数据库同类型租户的数据迁移项目,通过结构迁移、全量迁移和增量同步,无缝迁移源端数据库中的存量业务数据和增量数据至目标端数据库。前提条件 数据传输已...

数据

例如,于2023年08月28日,电商公司发现2023年08月17日收集的某个产品的报表数据有误,需要重新输出2023年08月17日的报表数据,可以使用补数据来纠正报表数据。操作步骤 登录 数据管理DMS 5.0。在顶部菜单栏中,选择 集成与开发(DTS)>数据...

数据传输服务(上传)场景与工具

数据采集:MaxCompute支持将开源 Logstash 收集的日志数据流式写入MaxCompute。Flink实时写入:您可以通过 Flink 平台对流式数据进行实时写入。解决方案的可靠性 MaxCompute具有服务等级协议(SLA),因批量数据通道、流式数据通道默认使用...

JindoFS实战演示

Flume高效写入OSS Flume高效写入OSS 2021-06-01 Flume是一个分布式、可靠、高可用的系统,支持从不同数据源高效地收集、聚合、迁移大量日志数据,聚合到中心化的数据存储服务,被广泛用于日志收集场景中。由于OSS本身不支持Flush功能,而...

快速实现数据分类分级

数据安全中心DSC(Data Security Center)是一款数据安全中心产品,可以通过收集和分析数据库的信息,提供云上数据的分类分级(包括敏感数据识别)能力。本文介绍如何快速在DSC控制台实现数据分类分级。前提条件 已规划好要接入数据安全...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 云数据库 RDS 数据传输服务 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用