T+1多库合并建仓

上述方案可解决因数据而导致的用户体验问题,但在对分库分表数据进行大数据分析时,逻辑上的一个表被拆成了多张表,由于没有类似TDDL中间件来屏蔽物理表的拆分,进行数据分析时变得十分复杂。解决方案 T+1多库合并建仓是指通过DLA控制...

如何处理Tair集群数据倾斜

您可以在 性能监控 的 数据节点 页面中查看各数据分片节点的对应指标,通常情况下,若某数据分片节点(最高)的性能指标高出其他数据分片节点(最低)20%及以上时,可认为已产生数据倾斜,差值越数据倾斜程度越严重。下图介绍两个典型...

查询结果不符合预期的常见原因

Lindorm宽表经常会被应用在大数据链路中,如果写入链路出现问题,则可能导致写入延迟或无法正常写入数据,此时进行数据查询,该行数据还未写入,因此会产生无法查询到数据的情况。如果您在使用中遇到数据写入一段时间后才能查到的情况,...

如何处理Redis集群数据倾斜

在 Redis 集群中,若个别数据分片节点(Data Node)的内存使用率或CPU使用率、带宽使用率、延时等性能指标远远高于其他数据分片,该 Redis 集群可能已产生数据倾斜。数据倾斜严重时,会导致实例在整体内存使用率不高的情况下,发生内存逐出...

导入概述

此处的有效数据包括由于类型转换错误等数据质量问题而被过滤的数据数据质量问题可以参见 数据导入常见问题。MySQL和HTTP协议 StarRocks提供MySQL协议和HTTP协议两种访问协议接口来提交作业。Broker Load Broker导入,即通过部署的...

数据清理

背景信息 ODC 支持在源数据库中的数据归档到目标数据库后,删除源数据库中的数据,以提高数据库查询性能,降低在线存储成本。本文档旨在介绍如何通过提交数据清理工单实现归档数据。原理介绍 前提条件 清理的表中必须包含主键。注意事项 ...

DescribePackages-查询数据包的信息

调用本接口查询已完成扫描授权的MaxCompute数据包的信息,例如数据包的名称、数据包所属者的账号、数据包的风险等级等。接口说明 本接口一般用于 MaxCompute 数据包列表查询,便于搜索和敏感信息概览。QPS 限制 本接口的单用户 QPS 限制为 ...

创建Hologres数据

新建Hologres数据源用于实现Dataphin能够读取Hologres的业务数据,及能够向Hologres写入数据。在引入Hologres的业务数据至Dataphin和将Dataphin的数据写入至Hologres的场景中,您需要先创建Hologres数据源。本文为您介绍如何新建Hologres...

创建TDH Inceptor数据

通过创建TDH Inceptor数据源能够实现Dataphin读取TDH Inceptor的业务数据或向TDH Inceptor写入数据。本文为您介绍如何创建TDH Inceptor数据源。使用限制 Dataphin仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据源...

需求分析

本实验提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。业务背景 为了更好的制定企业经营策略,现需要从用户网站行为中获取网站用户群体基本画像数据,例如,用户群体地理属性、社会属性等,...

需求分析

本实验提供数据仅作为阿里云大数据开发治理平台DataWorks数据应用实操使用,所有数据均为人工Mock数据。业务背景 为了更好的制定企业经营策略,现需要从用户网站行为中获取网站用户群体基本画像数据,例如,用户群体地理属性、社会属性等,...

功能发布记录(2024年)

所有DataWorks用户 数据治理中心概述 数据治理中心新增物化视图功能 当您在面对大数据计算任务频繁且存在大量相似子查询场景时,DataWorks支持自动化治理,智能推荐物化视图,为您提供了一种智能化、自动化的解决方案。当您启用此功能时,...

数据归档

背景信息 ODC 支持定时将源数据库中的表数据归档至其它目标数据库中,以解决因线上数据增多影响查询性能与业务运作的问题。本文档旨在介绍如何通过提交数据归档工单实现归档数据。原理介绍 前提条件 归档的表中必须包含主键。注意事项 前置...

DTS_BINLOG_PARSER

DTS_BINLOG_PARSER解析结果是一个STRUCT类型,包含字段如下:struct:recordID long,-binlog的record ID|source string,-数据源信息,包括数据库类型,版本等等|dbTable string,-数据表名|recordType string,-操作类型,包括INSERT,DELETE...

离线同步能力说明

功能概述 离线同步支持的能力如下图所示:功能 描述 异构数据源间的数据同步 数据集成目前支持40+数据源类型,包括关系型数据库、非结构化存储、大数据存储、消息队列间的数据同步。您可以通过定义来源与去向数据源,并通过数据集成提供的...

DataWorks on EMR Serverless StarRocks最佳实践

了解DataWorks on EMR Serverless StarRocks DataWorks作为阿里云一站式大数据开发治理平台,通过数据源对接EMR Serverless StarRocks,可实现EMR Serverless StarRocks的数据集成、作业周期性调度,同时结合StarRocks引擎在数据分析和数据...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

轨迹层

数据项配置 说明 数据源 组件的数据源中通过 代码编辑 或 可视化编辑 展示了组件所包含数据字段。也可以修改 数据类型,灵活配置组件数据数据映射 当您需要自定义图表字段配置时,可以在 数据映射 模块设置不同的字段映射内容,将这些...

散点层

图表样式 散点层是3D地球的子组件,支持独立的样式和数据配置,包括散点的大小、颜色和类型以及经纬度等,能够以散点的形式表现地理位置上的点数据信息。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置 面板中输入您...

配置资产数据

本文档介绍配置资产数据的方法,以及资产数据面板的内容,包括数据接口、数据源、数据过滤器和数据轮询频次等。操作步骤 登录 DataV控制台。在 我的可视化 页面,单击您创建的可视化应用项目上方的 编辑 按钮。在画布编辑器页面,单击 图层...

资产目录

② 列表区 为您展示筛选后的数据源列表,包含 数据源、描述、环境、用途、类型、负责人、更新时间 等数据源详细信息,同时您可以单击 操作 列下 的图标,申请该数据源的读写权限。项目 ① 筛选区 您也可以根据 数据板块、项目模式、所属 ...

资产目录

② 列表区 为您展示筛选后的数据源列表,包含 数据源、描述、环境、用途、类型、负责人、更新时间 等数据源详细信息,同时您可以单击 操作 列下 的图标,申请该数据源的读写权限。项目 ① 筛选区 您也可以根据 数据板块、项目模式、所属 ...

数据治理中心概述

量化评估:健康分 健康分是依据数据资产在数据生产、数据流通及数据管理中的用户行为、数据特性、任务性质等元数据,使用数据处理及机器学习等技术,对各类型数据进行综合处理和评估,通过个人、工作空间维度客观呈现数据资产状态的综合...

创建数据脱敏规则

背景信息 DataWorks的脱敏场景分为静态脱敏和动态脱敏:动态脱敏:包括 数据开发/数据地图展示脱敏、数据分析展示脱敏、MaxCompute引擎层脱敏、Hologres引擎层脱敏 等场景。静态脱敏:指数据集成静态脱敏场景。各场景的详细介绍,请参见 ...

设计阶段

设计工作包含数据探查和系分设计两部分:数据探查旨在了解来源数据数据形态,例如数据质量、数据分布等。结合业务场景,帮助分析和判断需求实现的可行性以及找出潜在的数据问题和风险。系分设计则包括表设计、Mapping设计和调度设计等最...

创建同步MaxCompute

2.SYSTEM_TIME同步模式 建立DataHub Topic 备注:由于分区是根据 写入DataHub时间 来计算的,因此topic schema只需包含数据字段,不需要包含分区字段,如下图所示:向DataHub Topic写入数据,可以使用datahub-sdk进行数据写入。测试过程中...

申请、续期和交还表权限

若关闭生产数据安全模式,则您加入目标项目,且您在项目中的角色包含项目 资产权限-新建 的权限点,即可在开发环境创建表,如何开启生产数据安全模式,请参见 安全设置。若开启跨项目安全模式,则仅可在任务所在的项目中创建表,不能跨项目...

申请、续期和交还表权限

若关闭生产数据安全模式,则您加入目标项目,且您在项目中的角色包含项目 资产权限-新建 的权限点,即可在开发环境创建表,如何开启生产数据安全模式,请参见 安全设置。若开启跨项目安全模式,则仅可在任务所在的项目中创建表,不能跨项目...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能集 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

Dataphin新手引导

新手引导帮助您了解Dataphin的基础操作步骤,包括数据规划、规范定义、规范建模及发布与运维等操作此外,您可以通过导入示例模型快速体验Dataphin研发流程。计算引擎说明 仅当计算设置中的计算引擎为MaxCompute时,支持导入模型。新手引导...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

同步时源库为Db2 for LUW的注意事项及限制

说明 如为增量同步任务,DTS要求源数据库的数据日志保存24小时以上,如为全量同步和增量同步任务,DTS要求源数据库的数据日志至少保留7天以上(您可在全量同步完成后将数据日志保存时间设置为24小时以上),否则DTS可能因无法获取数据日志...

实时同步任务延迟解决方案

如果确认是事务或者临时的大量变更导致了任务延迟,则可以等待事务或者大量变更包含的变更数据被同步任务处理完成后,任务延迟会逐步被追上。确认是否有写入动态分区频繁切换问题(uploader map size has reached ...

批量或异步插入数据

批量插入数据 默认情况下,每个发送到云数据库ClickHouse的插入操作都会导致云数据库ClickHouse立即在存储中创建一个包含插入的数据以及其他需要存储的元数据信息。因此,相比较发送包含较少数据的大量插入操作,发送包含更多数据的较少...

通过整库迁移配置集成任务

离线整库迁移可用于将本地数据中心或在ECS上自建的数据库同步数据大数据计算服务,包括MaxCompute、Hive、TDH Inceptor等数据源。本文为您介绍如何新建并配置整库迁移任务。前提条件 已完成所需迁移的数据源创建。整库迁移支持MySQL、...

通过整库迁移配置集成任务

离线整库迁移可用于将本地数据中心或在ECS上自建的数据库同步数据大数据计算服务,包括MaxCompute、Hive、TDH Inceptor等数据源。本文为您介绍如何新建并配置整库迁移任务。前提条件 已完成所需迁移的数据源创建。整库迁移支持MySQL、...

告警事件

告警事件集中为您展示离线计算、实时计算、基线监控、数据质量模块的告警事件。本文为您介绍如何查看并处理告警事件。查看告警事件 在Dataphin首页,单击页面右上角的 图标,进入 告警中心 页面。在 告警事件 页面,单击 离线计算、实时...

告警事件

告警事件集中为您展示离线计算、实时计算、实时集成、基线监控、数据质量模块的告警事件。本文为您介绍如何查看并处理告警事件。查看告警事件 在Dataphin首页,单击页面右上角的 图标,进入 告警中心 页面。在 告警事件 页面,单击 离线...

推送记录

系统根据来源模块划分为不同的 告警原因:离线计算 包括 业务延迟过高、TPS超过范围、失败超过配置比例、数据滞留超过配置、出错、完成、运行超时、未完成。数据质量 包括 表规则异常、字段规则异常 和 自定义规则异常。数据服务 包括 平均...

资产全景

资产全景介绍 资产全景页面仅为您展示生产环境中的元数据及加工所得的应用数据包括以下三种模式:全局模式:以星球形式为您展示存储数据量大于0的业务板块及其概要信息。流动模式:展示数据的流入、整合与输出过程,更直观的体现数据加工...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据传输服务 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用