数据清理

背景信息 ODC 支持在源数据库中的数据归档到目标数据库后,删除源数据库中的数据,以提高数据库查询性能,降低在线存储成本。本文档旨在介绍如何通过提交数据清理工单实现归档数据。原理介绍 前提条件 清理的表中必须包含主键。注意事项 ...

数据归档

背景信息 ODC 支持定时将源数据库中的表数据归档至其它目标数据库中,以解决因线上数据增多影响查询性能与业务运作的问题。本文档旨在介绍如何通过提交数据归档工单实现归档数据。原理介绍 前提条件 归档的表中必须包含主键。注意事项 前置...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能集 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

浮框层

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

跨租户发布概述

跨租户发布数据用于迁移租户间的数据,以满足不同数据的应用场景,帮助企业实现数据应用价值最大化。前提条件 已购买跨租户发布增值服务。更多信息,请参见 购买指引。进行跨租户发布前,请确保目标环境已完成租户的计算引擎设置。更多信息...

跨租户发布概述

跨租户发布数据用于迁移租户间的数据,以满足不同数据的应用场景,帮助企业实现数据应用价值最大化。前提条件 已购买跨租户发布增值服务并且当前租户已开通跨租户发布模块;跨租户发布过程中,若需要导出或导入标签架构、标签、质量对象,...

功能发布记录 2022年之前

DataWorks数据治理中心新增资源使用分析功能,从 MaxCompute存储消耗、MaxCompute计算消耗、DataWorks调度消耗、DataWorks离线同步消耗 个维度展示资源消耗总览、资源消耗异动,以及资源消耗明细。2021.12.9 全部地域。透视分析:按资源...

简介

HBase Ganos是什么 HBase Ganos是阿里云推出的一款包含管理 空间几何数据、时空轨迹、专题栅格、遥感影像的时空大数据引擎系统。系统兼容开源GeoMesa、GeoServer等生态,内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等,...

迁移 TiDB 数据库的数据至 OceanBase 数据库 MySQL ...

本文为您介绍如何使用数据传输迁移 TiDB 数据库的数据至 OceanBase 数据库 MySQL 租户。重要 如果数据迁移项目长期处于非活跃状态(项目状态为 失败、已暂停 或 已完成),受增量日志保留时长等影响,项目可能无法恢复。数据传输将主动释放...

什么是DataWorks

DataWorks基于MaxCompute、Hologres、EMR、AnalyticDB、CDP等大数据引擎,为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与...

数据库管理

每个Database都有若干时序数据表,结合 名词解释 的描述,我们可以对时序引擎的数据层级归纳为下图所示:如果一个Lindorm时序引擎实例计划包含不相关的项目数据,在很程度上,彼此之间是隔离的。那么在这种情况下,建议将它们放到单独的...

区域热力层(v1.x版本)

根据需要自定义区域边界,如中国内地可以分为东部地区、西部地区、华南地区、华北地区、华中地区五区,可以根据对应包含的省级边界数据合并得到。数据应用。将提取到的数据配置到DataV中,配置方法如下。选择 区域热力层>数据>地理边界...

功能更新动态(2023年)

创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成 新增Apache Doris数据源的离线集成。整库迁移任务支持...

文档更新动态(2023年)

更新说明 创建MySQL数据源 创建PolarDB-X数据源 创建AnalyticDB for MySQL 2.0数据源 创建AnalyticDB for PostgreSQL数据源 创建达梦(DM)数据源 创建TiDB数据源 创建Kafka数据源 离线集成配置优化 新增Apache Doris数据源的离线集成。...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

区域热力层(v2.x版本)

区域热力层是基础平面地图的子组件,支持独立的样式、数据和交互配置,包括区域的标注、颜色、边线、鼠标交互事件以及位置信息等,能够以热力区域的形式表现地理位置上的区域信息。本文介绍区域热力层各配置项的含义。注意 当前为v2.x版本...

批量或异步插入数据

批量插入数据 默认情况下,每个发送到云数据库ClickHouse的插入操作都会导致云数据库ClickHouse立即在存储中创建一个包含插入的数据以及其他需要存储的元数据信息。因此,相比较发送包含较少数据的大量插入操作,发送包含更多数据的较少...

发展历程

关键性里程碑 2009年9月,ODPS(即现在的MaxCompute)大数据平台飞天项目正式启动。2010年10月,阿里巴巴集团自主研发的第一代云计算平台稳定运行。2013年8月,平台的单集群规模已达到5000台。2014年7月,平台开始对外提供服务,完全替换...

内置时空数据引擎Ganos

提供拓扑网络路径分析和规模点云存储与查询支持 Ganos所包含的几何网络数据库引擎支持Node-Edge拓扑网络构建,支持Turn、U-Turn等概念,支持TSP(旅行商问题)、KSP(多条线路最短路径)、TRSP(转向限制的最短路径)等一系列路径规划...

使用执行计划分析查询

诊断结果 单击执行计划树中某个Stage(如 Stage[1]),即可在右侧查看对应Stage的 诊断结果 详情,包括如下两类诊断:Stage诊断:这类诊断结果包含了对目标Stage诊断结果的详细说明,包括诊断出的问题(如存在较数据量被广播或数据倾斜...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

数据中心

主要功能包括数据表引入、本地数据导入。数据表 支持用户从已注册的计算资源类型中添加数据表。支持基于已添加的数据查看表信息、表内展示的字段。支持将已添加的源表数据进行删除。本地数据 支持用户通过上传本地文件方式将数据集导入至...

OSS数据安全防护最佳实践

背景信息 敏感数据主要包括个人隐私信息、密码、密钥、敏感图片等高价值数据,这些数据通常会以不同的格式存储在您的OSS Bucket中,一旦发生泄漏,会给企业带来重大的经济和名誉损失。DSC 在您完成数据源识别授权后,从您存储在OSS的海量...

面临的业务挑战

数据来源上包含数据数据、日志数据、对象数据以及已有数仓上的存量数据等。这些不同来源、不同格式的数据,各自又有不同的访问和分析方式,而大量传统企业基于关系数据库构建自己的业务系统,已经非常熟悉按SQL的方式去使用数据,这无疑...

入湖基础操作

关系数据库实时入湖:可以实现RDS MySQL或PolarDB数据库表数据增量同步到数据湖,选择在数据源管理中配置好的数据源,将数据源对应数据库中选定表的数据抽取binlog的方式将数据库表数据实时同步回放到数据湖中。待同步的数据表需确认包含...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

功能简介

数据管理:展示并管理用户添加的数据,主要功能包括数据表引入、本地数据导入。数据配置:展示并管理用户添加的计算资源。算子中心 算子中心包含算子管理、算子配置。算子管理:展示并管理用户添加的脚本算子,已添加的算子可在模型画布中...

新建 Kafka 数据

配置好数据源是创建数据迁移或数据同步项目的前提。本文为您介绍如何在数据传输中新建 Kafka 数据源。使用限制 数据传输仅支持 Kafka 数据源作为数据同步的目标端。背景信息 数据传输的安全问题,贯穿服务连通性验证、链路创建和数据传输...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

DTS_BINLOG_PARSER

DTS_BINLOG_PARSER解析结果是一个STRUCT类型,包含字段如下:struct:recordID long,-binlog的record ID|source string,-数据源信息,包括数据库类型,版本等等|dbTable string,-数据表名|recordType string,-操作类型,包括INSERT,DELETE...

产品架构

LindormStream内部包含流存储、流计算两组件,通过两者的一体化部署和深度融合,支持流数据的高性能实时处理。其中,流存储负责消息日志数据的写入和订阅,兼容开源Kafka API,并且数据持久化存储在底层LDFS中,具备高吞吐、低成本、弹性...

Hologres物理表和字段详情

变更信息:包括数据变更、最近访问、DDL变更。数据变更:Dataphin基于SQL解析到的最近1次表内容变更时间(对应DML操作),外部系统触发的变更不统计,实时更新。最近访问:Dataphin基于SQL解析到的最近1次select时间(对应DQL操作),外部...

Hologres物理表和字段详情

变更信息:包括数据变更、最近访问、DDL变更。数据变更:Dataphin基于SQL解析到的最近1次表内容变更时间(对应DML操作),外部系统触发的变更不统计,实时更新。最近访问:Dataphin基于SQL解析到的最近1次select时间(对应DQL操作),外部...

逻辑表和字段资产详情

变更信息:包括数据变更、最近访问、DDL变更。数据变更:Dataphin基于SQL解析到的最近1次表内容变更时间(对应DML操作),外部系统触发的变更不统计,实时更新。最近访问:Dataphin基于SQL解析到的最近1次select时间(对应DQL操作),外部...

逻辑表和字段资产详情

变更信息:包括数据变更、最近访问、DDL变更。数据变更:Dataphin基于SQL解析到的最近1次表内容变更时间(对应DML操作),外部系统触发的变更不统计,实时更新。最近访问:Dataphin基于SQL解析到的最近1次select时间(对应DQL操作),外部...

管理数据

查看已上传数据表详情,包括但不限于数据地图、数据量、数据表大小及项目引用情况。刷新数据库/文件夹/表 选择需要查看的层级,单击右上角的 图标,完成刷新操作。改变数据库/文件夹显示模式 选择需要查看的层级,单击右上角的 图标或 图标...

计费逻辑说明

资源费用明细:数据服务API调用 数据质量 数据质量可对任务产出的表数据进行数据质量监控,DataWorks将根据数据质量规则实例数量计费。资源费用明细:数据质量 OpenAPI DataWorks提供OpenAPI,您可基于OpenAPI实现业务定制化开发,...

Kafka实时入湖

本文为您介绍如何在数据湖构建(Data Lake Formation,简称DLF)中使用Kafka实时入湖任务将数据同步到数据湖中。重要 数据入湖功能已经停止更新,如果您有数据入湖需求请参考:数据入湖停止更新公告。前提条件 已开通数据湖构建服务,尚未...

账单数据订阅及查询分析

DataWorks及MaxCompute:DataWorks基于MaxCompute等大数据引擎,支持您在线进行SQL分析、业务洞察、编辑和分享数据,以及将查询结果保存为可视化图表卡片,快速搭建可视化数据报告。订阅账单数据后,用户中心会将相关账单数据同步至指定...

DataWorks模块使用说明

使用流程概览:参考文档:数据集成概述 数据建模与开发 子模块:数据建模 功能说明:数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标个方面,以业务视角对业务的数据进行...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用