数据质量评估标准

一致性 一致性通常体现在跨度很数据仓库。例如,某公司有很多业务数仓分支,对于同一份数据,在不同的数仓分支必须保证一致性。从在线业务库加工到数据仓库,再到各个数据应用节点,用户ID必须保持同一种类型,且长度也要保持一致...

PolarDB-X适用场景

高负载低延时交易 场景描述 交易场景广泛存在于互联网业务中,交易系统是信息系统中最为核心的组件之一。业务连续性、事务一致性和系统安全性是交易系统正常运行的基础,长时间高负载低延时的运行是互联网时代交易系统的发展方向。产品能力...

数据追踪

基础配置项:配置 数据追踪默认审批模板,当 审批规则校验 未配置审批流程时,系统会采用此默认的审批模板。您可以更改默认审批模板的审批流程,详情请参见 修改默认审批模板。审批规则校验:系统会根据 审批规则校验 定义的规则对数据...

数据服务

什么数据服务无法连接ECS自建的数据库?是否必须开通API网关?如何配置数据源?数据服务是否支持MaxCompute(ODPS)数据源?向导模式生成API与脚本模式有何功能差异?数据服务的API分组的作用是什么,与API网关的分组有什么关联?...

管理数据库

创建RDS MariaDB实例后,您需要在实例创建与您业务相关的数据库。RDS MariaDB支持通过控制、SQL命令、API接口管理数据库,包括创建、删除数据库。背景信息 概念 实例:实例是虚拟化的数据库服务器。您可以在一个实例创建和管理多个...

功能简介

AnalyticDB PostgreSQL版 的企业数据智能平台是数据资产定义、加工、管理、服务的全流程平台,提供数据同步、数据查询、数据建模、数据开发、质量评估、资产管理等功能,为智能数据应用持续稳定供给全量、标准、干净、智能的数据资源。...

应用场景

交易支付透明拆分 交易支付是蚂蚁集团最核心的一个业务,最初采用的是分库分表的解决方案。分库分表的方案给核心业务带来了水平扩展的能力,同时也带来了灰度升级的能力,让核心业务系统性风险大大降低。但随着支付宝业务的飞速发展,...

快照概述

什么数据库文件系统快照 数据库文件系统快照是某一时间点文件系统状态的备份文件,文件系统部署在云盘上,因此文件系统快照服务实际上基于云盘快照,对某个文件系统打快照相当于对该文件系统所部署的所有云盘同时打快照。文件系统第一份...

数据集成支持的数据

不同集成类型适用场景 集成类型 适用场景 离线集成 适用于数据上云、云上数据迁移到本地业务系统等场景。例如,将本地数据库MySQL的数据迁移至阿里云数据库RDS。整库迁移 适用于将本地数据中心或在ECS上自建的数据库,同步数据至离线数仓...

划分数据

数据仓库是面向主题(数据综合、归类并进行分析利用)的应用。数据仓库模型设计除横向的分层外,通常也需要根据业务情况纵向划分数据域。数据域是联系较为紧密的数据主题的集合,是业务对象高度概括的概念,目的是便于管理和应用数据。通常...

数据分析整体趋势

随着AWS,Azure,Alibaba,Google等云厂商的出现,云原生分布式数据仓库成为目前数据分析技术的主要解决方案,代表性云服务包括Amazon Redshift,Snowflake,Alibaba Cloud AnalyticDB,Google BigQuery等。这些云原生数据仓库技术分别起源...

划分数据

划分数据域 通常,您需要阅读各源系统的设计文档、数据字典和数据模型设计文档,研究逆向导出的物理数据模型。进而,可以进行跨源的主题域合并,跨源梳理出整个企业的数据域。数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。...

数据

数据域是联系较为紧密的数据主题的集合,通常是根据业务类别、数据来源、数据用途等多个维度,对企业的业务数据进行的区域划分,将同类型数据存放在一起,便于您快速查找需要的内容。不同使用目的数据,分类标准不同。例如,电商行业通常...

导入概述

为了更好地满足各种不同的业务场景,StarRocks支持多种数据模型,StarRocks存储的数据需要按照特定的模型进行组织。本文为您介绍数据导入的基本概念、原理、系统配置、不同导入方式的适用场景,以及一些最佳实践案例和常见问题。背景信息...

升级实例配置

说明 若数据传输控制自动跳转至数据管理DMS控制,您可以在右下角的 单击,返回至旧版数据传输控制。在左侧导航栏,单击 数据迁移 或 数据同步。在目标实例处单击 升级。选择链路规格并勾选 数据传输服务协议。说明 关于链路的规格...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

通过DTS采集数据

通过阿里数据传输数据同步(DTS),将RDS的数据实时传输至DataHub。创建DataHub项目。登录 DataHub控制。在 项目管理 ,选择区域,本案例选择 华东1 区。单击 创建Project,输入 名称 和 描述,创建一个DataHub项目。本案例的...

资产全景

数据经采集、集成、加工等流程处理完成后,可以在数据资产模块进行系统化管理。本文为您介绍数据资产全景的全局、流动和结构化模式。资产全景介绍 资产全景页面仅为您展示生产环境的元数据及加工所得的应用数据,包括以下三种模式:全局...

受众与核心能力

本文为您介绍DataWorks的产品定位、产品受众和产品的核心能力。产品定位 DataWorks致力于为数据开发者、数据分析师、数据资产管理者,打造一个具备...让数据从采集到展现、从分析到驱动应用得以一站式解决,真正实现数据业务化、业务数据化。

什么数据资源平台

阿里云数据资源平台是数据资产定义、加工、管理、服务的全流程平台,提供数据同步、数据查询、数据标准、数据建模、数据加工、质量评估、业务模型构建、资产管理、数据服务等功能,为智能数据应用持续稳定供给全量、标准、干净、智能的数据...

案例介绍

业务中台系统覆盖整个零售体系的会员(人)与商品/库存(货),并且集中处理订单与营销内容。电商系统与门店系统分别对应线上零售与线下零售。ERP系统主要是用于供应链管理。规划数仓 规划业务板块。某公司实行的是事业部制,各事业部之间...

资产全景

数据经采集、集成、加工等流程处理完成后,可以在数据资产模块进行系统化管理。本文为您介绍数据资产全景的全局、流动和结构化模式。资产全景介绍 资产全景页面仅为您展示生产环境的元数据及加工所得的应用数据,包括以下三种模式:全局...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

导入概述

为了更好地满足各种不同的业务场景,StarRocks支持多种数据模型,StarRocks存储的数据需要按照特定的模型进行组织。本文为您介绍数据导入的基本概念、原理、系统配置、不同导入方式的适用场景,以及一些最佳实践案例和常见问题。背景信息...

规格及选型

多个实例间可实现数据共享,无需担心业务中台的发展和数据体系建设会造成数据孤岛;独立的实例可完全保证资源隔离;每个业务的使用情况也可以直接反映在账单上。案例八:构建数据开发平台 用户需要构建一个数据开发平台,期望减少开发过程...

数据库克隆

数据管理DMS的数据库克隆功能支持将源数据库的表结构和表数据复制至目标数据,实现全部表或部分表备份,适用多环境数据库初始化,例如将开发环境复制到测试环境。前提条件 源数据库与目标数据库类型相同,且都为MySQL。数据库实例的...

确定需求

举例:数据分析师需要了解A公司电商业务中厨具类目的成交金额。当获知这个需求后,您需要分析:根据什么(维度)汇总、汇总什么(度量)以及汇总的范围多(粒度)。例如,类目是维度,金额是度量,范围是全表。此外,还需要思考明细数据...

通过DMS连接StarRocks实例

数据管理DMS(Data Management)是一款支撑数据全生命周期的一站式数据管理平台。您只需在DMS控制录入StarRocks实例的相关信息,即可轻松实现通过图形化的Web界面对StarRocks实例的高效管控与深度运维,极提升数据管理体验及操作效率。...

应用场景

互联网类应用 Cassandra能够支持并发低延时的访问需求,具备高...在一些需要应用大量数据对用户行为进行分析的场景,可以通过整合多种数据来源,存储用户行为数据,构建用户画像,实时存储在Cassandra,提供大数据风控、推荐等服务。

发展历程

2018年 MaxCompute的多个客户案例荣获“2017大数据优秀产品和应用解决方案案例”奖。基于公共云的BigBench在100 TB规模上,MaxCompute的性能指标较2017年10月提升了一倍,达到18176.71 QPM(Queries Per Minute)。此外,在超小型10 TB规模...

确定需求

举例:数据分析师需要了解A公司电商业务中厨具类目的成交金额。当获知这个需求后,您需要分析:根据什么(维度)汇总、汇总什么(度量)以及汇总的范围多(粒度)。例如,类目是维度,金额是度量,范围是全表。此外,还需要思考明细数据...

数据加工过程卡点校验

本文为您介绍在线或离线业务系统数据在生成过程进行的卡点校验。在线系统卡点校验 在线业务系统产生的数据数据仓库的重要数据来源。在线业务系统复杂多变,每次变更都会产生数据的变化。因此,数据仓库需要适应多变的业务发展,及时...

客户案例

但在报表开发的演进过程,报表平台逐步建立起业务系统分离,由之前的面向报表的开发模式,转变为面向指标的通用解决方案,这就把报表开发的问题拆解为细粒度的指标组合,不同的指标依赖的计算存储模型会根据业务的特性会有极的不同。...

互联网、电商行业离线大数据分析

通过阿里云MaxCompute、云数据库RDS MySQL、DataWorks等产品,可以实现互联网、电商网站的离线数据分析,且支持通过DataV大屏展示分析后的业务指标数据。概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标...

基本概念

数据库实例:数据库实例是在云中运行的独立数据库环境。一个数据库实例可以包含多个由数据库用户创建的数据库,并且...索引:索引是数据库管理系统数据库表中一个或多个列的值进行排序的数据结构,使用索引可快速访问数据库表的特定信息。

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

入湖基础操作

可以实现RDS MySQL或PolarDB数据库表数据全量同步到数据湖,选择在数据源管理配置好的数据源,将数据源对应数据选定表的数据全量同步到OSS,如果待同步表中数据,则所消耗的资源也会比较,建议在业务低谷期执行此类任务,...

概述

背景信息 在大数据生态系统中,Alluxio位于数据驱动框架或应用(例如Apache Spark、Presto、TensorFlow、Apache Flink和Apache Hive等)和各种持久化存储系统(例如HDFS和阿里云OSS)之间,使得上层的计算应用可以通过统一的客户端API和...

用自然语言实时查看BI报表

本文介绍了PolarDB NL2BI解决方案的背景、应用场景以及如何体验NL2BI解决方案。背景 为了让不熟悉SQL语言的用户能方便地从数据取数分析,PolarDB for AI联合达摩院推出自研的自然语言到数据库查询语言转义(Nature Language To SQL,...

数据质量:全流程的质量监控

DataWorks的全流程数据质量监控功能为您提供35种预设表级别、...数据质量为您解决以下问题:数据库频繁变更问题 业务频繁变化问题 数据定义问题 业务系统的脏数据问题 系统交互导致质量问题 数据订正引发的问题 数据仓库自身导致的质量问题
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用